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Einleitung 


Der Vorgang, bei dem digitale Daten im Zuge der Computerisierung entstehen, 
gespeichert und manuell oder automatisch ausgewertet werden, entzieht sich der 
unmittelbaren und vollständigen Beobachtbarkeit durch den Menschen. Es mag 
zwar in gewissem Grad ein Bewusstsein tiber vermeintliche Konsequenzen oder 
Resultate geben, wenn digitale Daten entstehen, gespeichert oder ausgewertet 
werden. Man kann jedoch nicht vollumfanglich und oft nur mit groBer Мйһе 
im Ansatz nachvollziehen, wie Mechanismen der mittlerweile weltumspannenden 
Datenentstehung und -verwertung ablaufen und permanent produzierte Ergeb- 
nisse zustande kommen. Das hat vor allem zwei Griinde: Zum einen kann der 
technische Vorgang nunmehr, und damit anders als bei vielen anderen menschli- 
chen Werkzeugen und Produkten, nicht direkt und umfassend tiber den visuellen 
menschlichen Wahrnehmungskanal aufgenommen werden. Der Computer, tiber 
den man in der Regel Zugang zu den digitalen Daten erhält, ist dann eine soge- 
nannte ‚Black Box‘, deren Inhalt und interne Mechanismen für Betrachtende nicht 
unmittelbar ersichtlich sind. Zum anderen kommt es im Zuge der Digitalisie- 
rung, die hier zunächst als eine fortschreitende Computerisierung von Alltag und 
Lebenswelt zu verstehen ist, zu einer Vervielfachung und Verstetigung der daten- 
produzierenden Anwendungen und der informationstechnischen Werkzeuge, die 
einen Zugriff oder — um hier die Analogie des Sehens fortzuführen — einen Ein- 
blick in diese digitalen Daten erlauben und Datenverarbeitungsprozesse überhaupt 
erst möglich machen. 

Die weitreichende Nicht-Einsehbarkeit der Artefakte der Computerisierung 
geht einher mit einer fast ebenso weitreichenden Nicht-Nachvollziehbarkeit ihrer 
latenten sozialen Mechanismen und der gesellschaftlichen Konsequenzen. Dabei 
ist es gerade die computergestützte Datenverarbeitung, die zusammen mit dem 
Überbegriff der Digitalisierung auf eine weitgehend positive Grundhaltung bei 
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den Menschen stößt (acatech & Körber Stiftung, 2020; Bitkom, 2014; Europäi- 
sche Kommission, 2010, 2017b; Initiative D21 e. V., 2020; Lünich & Marcin- 
kowski, 2018). Die Gesellschaft weiß um die vermeintlich elementare Bedeutung 
der digitalen Computertechnik und informationsverarbeitender Systeme für die 
Welt. Sie beschreibt sich selbst mitunter bereits als eine digitale Gesellschaft. 
Ein Abschalten der Digitaltechnik ist also mittlerweile undenkbar geworden und 
es gibt vermeintlich kein Zurück hinter den Status quo. Vielmehr hat man 
sich mit dem gesellschaftlichen Vordringen von Phänomenen und Artefakten 
der Digitalisierung und mit der mit ihnen einhergehenden digitalen Datensamm- 
lung und -verwertung anscheinend abgefunden, trotz substantieller nachteiliger 
und risikobehafteter Entwicklungen wie bspw. Privatheitsrisiken und der Nicht- 
Nachvollziehbarkeit automatisiert im Hintergrund getroffener Entscheidungen 
durch vernetzte Computersysteme. Sei es unverzichtbare Steuerungstechnik in 
Industrie, Handel und Verkehr oder lediglich das Smartphone, auf das bereits die 
Mehrheit aller Jugendlichen im Leben nicht mehr verzichten will (Bitkom, 2019). 
Vielerorts wird mithin noch mehr Digitalisierung gefordert, selbst wenn zunächst 
oft ungeklärt bleibt, was eigentlich konkret gemeint ist, wenn mit Bezug auf die 
Verbreitung von Computertechnik und den damit einhergehenden gesellschaftli- 
chen Veränderungen derzeit ganz allgemein von der Digitalisierung gesprochen 
wird. 

Dieser Umgang der Gesellschaft mit der Digitalisierung wirft Fragen auf: 
Woher rühren die weit verbreiteten Überzeugungen von der positiven Wirkmäch- 
tigkeit der Digitalisierung? Worauf genau beziehen sich überhaupt die gesell- 
schaftlichen Erwartungen, wenn es um den positiven Einfluss der Digitaltechnik 
geht? Und welche Konsequenzen haben diese Erwartungen für Legitimation und 
Delegitimation von Handeln und Entscheiden in der digitalen Gesellschaft? 

Analog zum politischen Handeln bezieht auch das Handeln in der sich digi- 
talisierenden Gesellschaft „seine Rationalität wie auch seine Legitimität aus 
bestimmten Annahmen oder Vorstellungen über die Wirklichkeit. Argumente, 
Programme und Begriffe (...) spiegeln nicht die reale Welt, sondern spezifische 
Interpretationen derselben wider“ (J. Hofmann, 1993, S. 13). Diesen mittelbaren 
wirklichkeitskonstruierenden Zugang und Umgang mit der Digitalisierung unter- 
sucht die vorliegende Arbeit an einem ihrer zentralen Elemente: den digitalen 
Daten, die im Zuge der Digitalisierung und der Verbreitung von Informations- 
und Kommunikationstechnologie (IuK) laufend weltweit entstehen, gespeichert, 
zusammengeführt und ausgewertet werden. Die hierbei entstehenden großen digi- 
talen Datenbestände werden auch als Big Data bezeichnet: ein Begriff, der 
eine besondere Wahrnehmung von digitalen Daten und Erwartungen an diese 
formuliert. 
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Die Funktion digitaler Daten im Rahmen der Digitalisierung ist dabei ihrem 
Wesen nach zu allererst eine mathematische, betrifft hier Zahlen, Symbole und 
Formeln. Kurzum ist Information gemeint; ausgedrückt in einer binär codier- 
ten Sequenz von Zustandsbeschreibungen, die elementar für das Funktionieren 
der Digitaltechnik sind. Digitale Daten zeitigen dann allerdings insbesondere 
immer dort soziale Konsequenzen, wo sie menschliche Entscheidungen beeinflus- 
sen (Mau, 2017; Mayer-Schönberger & Cukier, 2013; Nassehi, 2019; Reckwitz, 
2017). Doch wie nähert man sich einem nicht direkt und unmittelbar zu 
beobachtenden Untersuchungsgegenstand? Wie Hofmann (1993) betont, hat es 
sozialwissenschaftliche Forschung ja gerade „nicht mit eindeutigen Tatbestän- 
den (...) zu tun, sondern mit theoriegeladenen Konstrukten, bestehend aus einem 
Amalgam sozialwissenschaftlicher und alltagsweltlicher Definitionen, Konven- 
tionen und Abstraktionen“ (S. 14). Als solch ein theoriegeladenes Konstrukt 
müssen mit Blick auf die notwendige Analyse ihrer sozialen Wirkmächtigkeit 
auch digitale Daten verstanden werden. 

Die vorliegende Arbeit versucht dabei mittels einer umfassenden sozialwis- 
senschaftlichen Analyse Antworten auf die zuvor aufgeworfenen Fragen zur 
Wahrnehmung der Digitalisierung in der Gesellschaft zu geben. Dabei ermöglicht 
das nachfolgend beschriebene Vorgehen eine empirisch geleitete Reflexion über 
die menschliche Perspektive auf eine der zentralen Erzählungen der digitalisier- 
ten Gesellschaft: den Mythos Big Data und seine Rolle für die gesellschaftliche 
Wahrnehmung der Entwicklungen der Digitalisierung. Die folgenden Ausfüh- 
rungen lassen sich dabei in zwei Teile aufteilen und geben die übergeordnete 
Strukturierung der Arbeit vor. Gesellschaftliche Diskurse zur datengetriebenen 
Digitalisierung und Wissensgesellschaft führen zu einem Wahrnehmungsmuster 
von digitalen Daten, das — so das Argument des ersten Teils der vorliegen- 
den Arbeit — in einem weit verbreiteten Glauben in Bezug auf digitale Daten 
münden könnte. Wie gezeigt werden wird, vereint dieses sogenannte ,Big- 
Data-Glaubenssystem‘ (BDGS) für das Individuum nur mittelbar zu erfahrende 
und somit weitgehend unnachprüfbare Eindrücke, die mit digitalen Daten im 
Rahmen der Digitalisierung verbunden sind. Diese Wahrnehmungen können 
vor dem Hintergrund der gesellschaftlichen Erzählung einer Wissensgesellschaft 
und deren Resonanz in den persönlichen Überzeugungen von Erkenntnis- und 
Nutzengewinnen integriert werden. 

Dabei wird in Kapitel 2 zunächst allgemein auf die Digitalisierung als überge- 
ordnetes Phänomen sowie auf die an sie unter den Vorzeichen sozialen Wandels 
gerichteten Erwartungen abgestellt. Es ist dann auf die digitalen Daten einzu- 
gehen, die bezüglich des (Selbst-)Verständnisses der digitalisierten Gesellschaft 
eine zentrale Rolle einnehmen. Abgeleitet von den geläufigen Definitionen des 
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Begriffs Big Data wird in Kapitel 3 gezeigt, welche konkreten epistemischen Vor- 
stellungen in Bezug auf die digitalen Datenbestände im Glaubenssystem bestehen 
können und mithin beobachtbar sein sollten. Dafür wird, ausgehend von den 
Beschreibungsdimensionen von Big Data, die ihren Ursprung in einer primär 
wissenschaftlich-industriellen Perspektive auf die großen digitalen Datenbestände 
nehmen, zum einen ein allgemeines Verständnis für die Beschaffenheit der digi- 
talen Daten hergestellt. Zum anderen wird in Kapitel 4 der Verwertungs- und 
Wirkungszusammenhang digitaler Daten adressiert, der zu einem sogenannten 
Mythos Big Data beiträgt (boyd & Crawford, 2012). Die an diesen geknüpften 
Erwartungen an die Richtigkeit der Daten und aus ihnen gewonnenen Erkennt- 
nis bilden zentrale Elemente des Glaubenssystems. Diese besondere Qualität 
der digitalen Daten für Erkenntnis und Wissen fallen hier auf einen frucht- 
baren Boden, der in den letzten Jahrzehnten durch die öffentlichen Diskurse 
über die angesprochene Wissensgesellschaft bestellt wurde. In deren Rahmen 
hat eine Bewertungs- und Vergleichslogik Ausbreitung gefunden, die in Kapi- 
tel 5 besprochen wird und in deren Rahmen sich der vermeintliche Nutzen der 
Digitalisierung für Individuum und Gesellschaft durch die Quantifizierung des 
Sozialen verdeutlichen lässt. Eine Erwartungshaltung, die sich aus der Wahrneh- 
mung der dokumentierten Potentiale digitaler Daten ergibt, lässt sich unter den 
Vorzeichen der Nicht-Nachprüfbarkeit der tatsächlichen Voraussetzungen, Quali- 
täten und Konsequenzen digitaler Daten dann in Kapitel 6 als Glaubenssystem 
skizzieren. 

Es schließen folglich in Kapitel 7 Fragen nach der Prävalenz und Konsequenz 
dieses Big-Data-Glaubenssystems an, die im zweiten Teil der Arbeit empirisch 
beantwortet werden. Es wird dabei zunächst in einer ersten Studie eine standardi- 
sierte kognitionspsychologische Messung dieses Glaubenssystems vorgeschlagen, 
für die aufbauend auf den Beschreibungsdimensionen von Big Data eine Itembat- 
terie für die Anwendung in Befragungsstudien entwickelt wurde. Wie in Kapitel 8 
dokumentiert, kam diese Itembatterie in einer Erhebung zur Skalenkonstruk- 
tion zum Einsatz. Diese führt zu einer vierdimensionalen Befragungsskala, die 
auf Einschätzungen der Genauigkeit, des Wissensgewinns sowie des individu- 
ellen und gesellschaftlichen Nutzens der großen digitalen Datenbestände Bezug 
nimmt. Die Skalenentwicklung wurde dann nachfolgend in zwei weiteren Erhe- 
bungen validiert und Ergebnisse aus der Anwendung im Feld werden in Kapitel 9 
berichtet. Es zeigt sich hierbei eine ausgeprägte Überzeugung von einem Wis- 
sensgewinn aus Big Data, der mit Erwartungen an zu realisierenden individuellen 
sowie gesellschaftlichen Nutzen durch die Sammlung und Auswertung großer 
digitaler Datenbestände einhergeht. 
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Mögliche Konsequenzen des Glaubens an digitale Daten für Legitimation und 
Delegitimation von Handeln und Entscheiden in der digitalen Gesellschaft werden 
dann in Kapitel 10 am Beispiel aktueller Fragen der gesellschaftlichen Einfüh- 
rung von Anwendungen der Künstlichen Intelligenz (KI) untersucht. Hierbei 
wurde in vier Erhebungen einer zweiten Studie geprüft, inwieweit sich prädis- 
positive Glaubensüberzeugungen des BDGS auf kognitive, affektive und konative 
Komponenten der Einstellung zu Computeranwendungen auswirken, mit deren 
Hilfe Muster in den großen digitalen Datenbeständen erkannt werden können. 
Hierzu werden der Aufbau und die Ergebnisse der Untersuchungszusammenhänge 
jeweils nachvollziehbar dokumentiert und diskutiert. Schlussendlich werden in 
Kapitel 11 die Ergebnisse der Arbeit zum Glauben an Big Data zusammengefasst 
und vor dem Hintergrund aktueller globaler Entwicklungen eingeordnet sowie 
Empfehlungen und Anschlussfragen für die Zivilgesellschaft, die Politik und die 
Wissenschaft formuliert. 
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Der vermeintliche Siegeszug der 2 
Digitalisierung 


„Der Siegeszug der Digitalisierung ist nicht aufzuhalten.“ So oder so ähnlich 
liest man es derzeit häufig in Einleitungen von studentischen Hausarbeiten, hört 
es in den Medien (Breitkopf, 2015) oder aus der Industrie (Siemens, 2017) und 
in etlichen Büchern, die sich dem vermeintlichen Siegeszug in Vergangenheit, 
Gegenwart und Zukunft widmen (Barrat, 2013; Kurzweil, 2005; Nassehi, 2019; 
Rid, 2017; Tegmark, 2018). Selbstredend kommen alle, die den Satz auf seinen 
Wahrheitsgehalt prüfen, schnell zu dem Ergebnis, dass er in dieser Bestimmtheit 
ohne gewisse Einschränkungen oder Relativierungen gar nicht geäußert werden 
könne. So lassen sich auf dem Zug der Digitalisierung von Sieg zu Sieg etli- 
che Irrwege und vermeintliche Niederlagen aufzeigen. Hiervon ganz abgesehen, 
ist die Digitalisierung anders als plakativ unterstellt jedoch zunächst einmal kein 
eigenständig handelnder Sieger. Das Postulat einer unentwegt von Sieg zu Sieg 
eilenden und dergestalt anthropomorphisierten Digitalisierung lässt folglich zwei 
unabdingbare Bezugsgrößen völlig außen vor: den Menschen und seine Gesell- 
schaft. Ohne den Menschen ist Digitalisierung eine leere Hülse, ja zunächst 
einmal überhaupt nicht denkbar. Ohne Gesellschaft und die in ihr praktizierte 
Arbeitsteilung könnte die Welt nur schwerlich in einem solchen Umfang digitali- 
siert werden, wie der Mensch dies Stand heute beobachten kann. Digitalisierung 
wird primär für und durch die Gesellschaft vorangetrieben (Wittpahl, 2017). 
Dreh- und Angelpunkt von Digitalisierung ist mithin das Individuum, eingebettet 
in eine soziale Situation innerhalb der Gesellschaft. Nur vor diesem Hintergrund 
lassen sich Erfolge und Misserfolge der Digitalisierung also überhaupt beurteilen. 
Und nur mit Blick auf in die Zukunft gerichtete individuelle und gesellschaftli- 
che Erwartungen und Prognosen sowie deren (Nicht-)Eintreffen ist der Siegeszug 
folglich zu begutachten. 

Doch was meint nun überhaupt Digitalisierung in ihrem untrennbaren Verhält- 
nis zu Mensch und Gesellschaft und wieso sollte eine dahingehend selbstreflexive 
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Analyse der an sie gerichteten Erwartungen von Bedeutung sein? Dem Grund- 
verständnis nach ist die Digitalisierung vordergründig nichts weiter als ein 
technischer Prozess, bei dem analoge Entitäten in ein digitales, meist binäres 
Format übertragen werden, mit dem Ziel, dieses mit Hilfe informationstechni- 
scher Infrastrukturen wie bspw. dem Computer zu speichern und zu verarbeiten 
(Brennen & Kreiss, 2016; Chun & Soderman, 2008; Storsul & Fagerjord, 2008). 
Schon hier zeigt sich, dass Digitalisierung im ursprünglichen Sinne lediglich auf 
binär codierte Information abstellt, ein dann digitales Datum. Jedoch verbirgt sich 
hinter jenem Phänomen, das wir insbesondere in Deutschland mit jenem Ober- 
begriff Digitalisierung bezeichnen, eine Vielzahl an unterschiedlichen Begriffen, 
Phänomenen, Erzählungen und Vorstellungen.! Die Erzählungen beginnen hier- 
bei meist mit einer einfachen Betrachtung von elektronischen Artefakten wie dem 
Computer im Zusammenspiel mit seinem menschlichen Nutzer und enden nicht 
selten in einer durch eben jene elektronischen Datenverarbeitungsanlagen aus- 
gelösten Transformation menschlicher Gesellschaften oder gar gleich in einer 
vollständigen digitalen Transzendenz menschlicher Biologie und Erfahrung — 
etwa, wenn es um Vorstellungen davon geht, die menschliche Seele in einen 
Computer ‚hochzuladen‘ (Barrat, 2013; Bostrom, 2016; Callaghan et al., 2017; 
Kurzweil, 2005; Tegmark, 2018). Etwas nüchterner betrachtet begründet sich der 


l Es sei an dieser Stelle darauf verwiesen, dass der Begriff Digitalisierung im Deutschen 
umfassender gebraucht wird als im Englischen. Wenn dort vom technischen oder sozia- 
len Phänomen Digitalisierung die Rede ist, wird meist entsprechend genauer differenziert: 
So meint Digitization meist nur die Abbildung von Informationen in einem digitalen For- 
mat (Storsul & Fagerjord, 2008), wenn es um soziale Konsequenzen geht, wird häufig von 
Computerization, ‚digital Revolution‘ etc. gesprochen (Kling & Iacono, 1988). Zwar defi- 
nieren auch Brennen und Kreiss (2016): “digitalization as the way many domains of social 
life are restructured around digital communication and media infrastructures” (S. 1). Eine 
einfache Übersetzung in Digitalization ist jedoch weithin weniger gebräuchlich und auch 
nicht zielführend, genauso wie die undifferenzierte Verwendung des Digitalisierungslabels 
zugunsten einer konkreten Benennung dessen, worüber man gerade spricht, vermieden wer- 
den sollte (Mahn, 2019). In loser Assoziation subsumieren sich in der deutschsprachigen 
Verwendung unter diesem Oberbegriff die materiellen Dinge der Digitalisierung, also die 
technischen Artefakte wie bspw. Computer oder Smartphone sowie auch die Infrastruktur 
des Internets mit ihren Rechenzentren, Glasfaserkabeln und Satelliten. Über diese greifbaren 
Objekte betrifft der Begriff Digitalisierung darüber hinaus jedoch auch weitreichendere Kon- 
zepte wie die sogenannten Sozialen Medien, vage Konzepte wie Industrie 4.0, das Internet 
of Things (IOT) usw. In diesen Konzepten kommt der Digitalisierung dann noch konkreter 
eine sozio-technologische Bedeutung zu, nämlich beim Einsatz von Computertechnologie als 
‚Werkzeug‘ durch den Menschen. Der Mensch prägt ihre Verwendung und ihre Verwendung 
prägt den Menschen, ohne hier einen Technikdeterminismus zu unterstellen (Smith & Marx, 
1994; Wyatt, 2008). 
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vermeintliche Siegeszug auf der vielfältigen, beinahe alle menschlichen Lebens- 
bereiche durchdringenden Verwendung von Computern und den vordergründig 
positiven Veränderungen, die diese Entwicklung mit sich bringt. Der vermeint- 
liche Gewinn besteht für das menschliche Individuum und seine Gesellschaft 
darin, einen Nutzen aus dieser fortschreitenden Digitalisierung zu ziehen, also 
Vorteile mit Blick auf Wirtschaft, Politik, Gesundheit, Kommunikation etc. zu 
erfahren, die ohne Digitalisierung so nicht möglich sind. Dabei kommt es mitun- 
ter auch zu überzogenen Zukunftserwartungen, was Digitalisierung leisten kann 
und soll. So formuliert der Journalist Jürgen Kaube mit Blick auf die Digitali- 
sierung der Schule folgende Beobachtung (Kaube, 2019): „Man muss heute in 
jedem Lebensbereich nur noch ‚Digitalisierung‘ sagen, und schon meldet sich 
der Verstand zugunsten von Visionen ab“ ($ 3). Was ist dran an dieser Aus- 
sage? Dient der Begriff Digitalisierung womöglich als eine ‚Applaus!‘-Anzeige, 
bei deren Aufleuchten das Publikum angehalten ist unreflektiert und ohne tat- 
sächlichen Anlass mitzuklatschen (Yudkowsky, 2018)? Ist der Begriff bloß ein 
Feigenblatt, das vor einer tiefergehenden Betrachtung und kritischen Nachfragen 
schützt, was und warum da nun wie durch Hard- und Software ergänzt, verändert, 
oder gar verbessert werden soll? Glauben Bürger*innen in Deutschland vielleicht 
tatsächlich, dass jede Maßnahme, die nur das Label Digitalisierung trägt, zum 
Selbstläufer wird, bei dem sich der Erfolg von selbst einstellt? Der gesellschaftli- 
che Umgang mit der Digitalisierung erscheint vielschichtiger und uneindeutiger, 
als es das digitale Kodierschema von 1 und 0 für Erfolg oder Misserfolg der 
Digitalisierung suggeriert. 

Schnell stehen wirkmächtige Begriffe im Raum wie bspw. die digitale Revo- 
lution, von der erwartet wird, dass sie nach und nach alle Gesellschaftsbereiche 
erfasst, durchdringt und nachhaltig verändert (Brown, 2019; Helbing, 2019; Isaa- 
cson, 2014; Kelly, 2009; Schirrmacher, 2015; Zysman & Newman, 2006). Dass 
Revolutionen — und nun eben auch die digitale — für gewöhnlich nicht zwangs- 
läufig zum Vorteil aller Beteiligten verlaufen und naturgemäß auch mit sozialen 
Kosten und Nachteilen verbunden sind, darf mit Blick auf den durch Digitali- 
sierung ausgelösten sozialen Wandel, der den Menschen direkt und unmittelbar 
betrifft, an dieser Stelle nicht vernachlässigt werden. Ein Beispiel: Nach anfäng- 
licher Euphorie über die vermeintlich demokratisierende und befreiende Kraft 
des Internets (Ghonim, 2012; Shirky, 2008) — einer dezentralen Infrastruktur der 
Digitalisierung mit zeitgleich zentraler gesellschaftlicher Bedeutung — melden 
sich auch immer wieder Stimmen, die hieran berechtigte Zweifel anmeldeten, 
wenn bspw. auf den gesellschaftlich nachteiligen Missbrauch der Technik durch 
autokratische Herrschaft oder Unternehmen verwiesen wird (Eubanks, 2018; 
Morozov, 2012, 2014; Mosco, 2014; Pariser, 2011; Sunstein, 2002). 
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Unter der Annahme, Digitalisierung sei für Individuum und Gesellschaft 
zumindest mit weitreichenden Konsequenzen behaftet und bedeutungsvoll, gebie- 
ten die diesbezüglich ablaufenden gesellschaftlichen Kommunikations- und Aus- 
handlungsprozesse eine sozialwissenschaftliche Analyse. Die zuvor angesproche- 
nen latenten, also nicht-beobachtbaren sozialen Konsequenzen der Digitalisierung 
können sozialwissenschaftlich analysiert werden, um sie trotz oder genau wegen 
ihrer Nicht-Einsehbarkeit sichtbar und verständlich zu machen. 

Dabei scheinen insbesondere die an die Konsequenzen der Digitalisierung 
geknüpften Vorstellungen und Erwartungen für das soziale Miteinander in 
menschlichen Gesellschaften ein lohnenswertes Unterfangen auf dem Weg, die 
forschungsleitende Frage zu beantworten: Was und wie denken Menschen über 
die Digitalisierung und wozu führt dieses Denken? Es gibt hier viele spezifische 
Erzählungen zur Digitalisierung, die ihre gesellschaftliche Wahrnehmung prägen 
und die spezifische Vorstellungen auszulösen vermögen, was Digitalisierung für 
den Menschen und das menschliche Miteinander im Rahmen sozialer Ordnung 
bedeutet. Bezugnehmend auf den insbesondere im anglophonen Raum eng mit 
der Digitalisierung verbundenen Begriff ‚Cyber‘ adressiert Rid (2017) dessen 
vielschichtige gesellschaftliche Bedeutung folgendermaßen: 


For politicians in Washington, the word stands for power outages that could plunge 
entire cities into chaos at any moment. For spies in Maryland, it stands for conflict and 
war, and for data being stolen by Russian criminals and Chinese spies. For executives 
in the City of London, it stands for major security breaches, for banks bleeding money, 
and for ruined corporate reputations. For inventors in Tel Aviv, it triggers visions of 
humans merging with machines, of wired-up prostheses with sensitive fingertips, and 
of silicon chips implanted under tender human skin. For science fiction fans in Tokyo, 
it stands for an escapist yet retro punk aesthetic, for mirrored shades, leather jackets, 
and worn-down, dusty gadgets. For romantic internet activists in Boston, it stands for 
a new realm of freedom, a space beyond the control of oppressive governments and 
law enforcement agencies. For engineers in Munich, it stands for steely control, and 
for running chemical plants by computer console. Ageing hippies in San Francisco 
nostalgically think back to wholeness and psychedelics and ‘turning on’ the brain. 


And for screen-addicted youth in between, ‘cyber’ means simply sex-by-video-chat. 
(5. ХШ) 


Die Vielschichtigkeit der Digitalisierung als soziales Phänomen bedeutet letzt- 
lich auch, dass es nicht die sozialwissenschaftliche Digitalisierungsforschung 
geben kann, sondern sich einzelne wissenschaftliche Disziplinen mit der sozialen 
Dimension bestimmter Phänomene und Kontexte der Digitalisierung befassen. 
Es ist daher notwendig, zunächst ein paar einführende Worte zur Einordnung 
der vorliegenden Arbeit in den sozialwissenschaftlichen Forschungskontext zur 
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Digitalisierung zu verlieren, um deutlich zu machen, auf welche Fragen die 
Leser*innen Antworten erwarten können und auf welche nicht. 


2.1 Erkenntnisinteressen und Forschungsobjekte der 
Digitalisierungsforschung 


Sozialwissenschaftliche Digitalisierungsforschung lässt sich nur schwer umfas- 
send beschreiben und klar von anderen, nicht digitalisierungsbezogenen For- 
schungsbemühungen abgrenzen. Hierfür gibt es diverse Gründe: Zum einen ist 
das verbindende Element aller Digitalisierungsforschung lediglich das Material- 
objekt, also die materiellen Artefakte der Digitalisierung selbst, auch wenn diese 
das zu untersuchende Phänomen nur mittelbar ermöglichen. Hier seien vor allem 
digitale ‚Dinge‘ wie zuallererst der Computer oder verwandte technologische 
Innovationen wie bspw. Smartphones genannt (Dogruel, 2013; Neuberger, 2008; 
Wagner, 1997). Das, was in engerem Sinne durch diese Computer-Artefakte 
beeinflusst und folglich untersucht wird, unterscheidet sich dann je nach dem 
sogenannten Formalobjekt der unterschiedlichen wissenschaftlichen Disziplinen. 

Hierzu gehört dann bspw. die Forschung im Bereich Social Robotics, mit 
einem eher materiellen Fokus auf technische digitalisierte Artefakte an der 
Schnittstelle der Human-Computer-Interaction (Goodrich & Schultz, 2007). So 
findet sich Forschung, die die menschliche Wahrnehmung in der Interaktion 
mit computerisierten Maschinen wie Pflegerobotern untersucht und bspw. Fra- 
gen nach deren Akzeptanz stellt (Heerink et al., 2010; Hudson et al., 2017), 
neben Untersuchungen zu den durch Digitalisierung und Automatisierung ausge- 
lösten Veränderungen auf dem Arbeitsmarkt (Savela et al., 2017), die zeigen, dass 
Menschen durchaus mit Emotionen wie etwa durch Bedrohungswahrnehmungen 
ausgelöste Angst auf vermeintlich autonome Maschinen reagieren (Liang & Lee, 
2017). 

Wenn man einmal auf die Kommunikationswissenschaft abstellt, ist das For- 
malobjekt die ‚(soziale) Kommunikation‘ (K. Beck, 2017), die mithin auch im 
Blickpunkt der vorliegenden Arbeit steht. Es interessiert also nicht die Digitali- 
sierung an sich, sondern von Interesse sind die Bedingungen und Konsequenzen 
ihrer kommunikativen Verhandlung innerhalb der Gesellschaft. Doch auch die 
Betrachtung der Digitalisierung im Rahmen dieser sozialen Kommunikation ist 
vielfältig. So gibt es kommunikationswissenschaftliche Forschung, die einer- 
seits die Bedingungen und Auswirkungen computervermittelter interpersonaler 
Kommunikation betrifft und andererseits digitalisierte öffentliche massenmediale 
Kommunikation in den Blick nimmt (K. Beck, 2006; Kimpeler et al., 2007; 
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Schweiger & Beck, 2010). Zu nennen sind hier allen voran die sogenannten 
‚Sozialen‘ Medien mit einem Fokus auf Kommunikation in den Onlineangebo- 
ten sozialer Netzwerke (Hautzer et al., 2012; J.-H. Schmidt, 2018). Dazu gehört 
auch die Forschung zu digitalisierten Öffentlichkeiten, die mögliche Konsequen- 
zen wie deren Zerfall (Jarren et al., 2000) und eine durch das Internet ausgelöste 
gesellschaftliche Fragmentierung untersucht (Mahrt, 2019; Webster & Ksiazek, 
2012; Zuiderveen Borgesius et al., 2016) und dabei u. a. Kommunikationsphäno- 
mene wie Echokammern auf vermeintliche Filterblasen in den virtuellen Räumen 
übertragen hat (Pariser, 2011; Sunstein, 2002). 

Die vorhergehenden Ausführungen dienen an dieser Stelle lediglich der 
Illustration der Vielseitigkeit sozial- und kommunikationswissenschaftlicher For- 
schung zur Digitalisierung. Sie dokumentieren jedoch, dass unter der Annahme 
einer fortschreitenden Digitalisierung eine tiefgreifende Beeinflussung der sozia- 
len Situation durch die Präsenz von Phänomenen der Digitalisierung in Gegenwart 
und Zukunft und diesbezüglicher sozialer Kommunikation erwartet wird, die ein 
Verständnis und Erklären dieser Veränderungen für das soziale Handeln in sei- 
nem jeweiligen Alltagskosmos dringend notwendig machen. Dabei bedeutet die 
Präsenz von Phänomenen der Digitalisierung, dass nicht zwingend materielle 
Artefakte der Digitalisierung in einer Situation präsent sein müssen, sondern 
lediglich, dass die Auswirkungen einzelner Phänomene, die auf Digitalisierung 
zurückzuführen sind, in der sozialen Situation zu beobachten und mithin zu 
analysieren sind. 


2.2 Die öffentliche Wahrnehmung der (Un-) 
Wahrscheinlichkeit des Siegeszuges der 
Digitalisierung vor dem Hintergrund der Konzeption 
der Wissensgesellschaft 


Dabei ist Digitalisierung kein Selbstläufer. Wem blühende Landschaften verspro- 
chen werden und wer im Nachhinein merkt, dass man ihm oder ihr potemkinsche 
Dörfer präsentiert, bei dem oder der sollten auch hier Zweifel kommen, wie 
zuverlässig gemachte Prognosen für die Zukunft tatsächlich sind, insbesondere 
mit Blick auf die gesellschaftlichen Auswirkungen von Großtechnologien. Dass 
etwaige Versprechungen und Erwartungen nicht eingelöst werden, lässt sich mit 
Blick auf die Entwicklung bspw. der Biotechnologie (Joppi et al., 2005) oder 
der Atomkraft (U. Beck, 1987; Hasegawa, 2012, 2014) beobachten. Es besteht 
die Einsicht, dass technologische Entwicklung ohne eine gleichzeitige Berück- 
sichtigung der potentiellen Risiken für die menschliche Gesellschaft undenkbar 
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ist (U. Beck, 1986). So wäre zumindest zu erwarten, dass eine Person, die 
regelmäßig beobachtet, dass Voraussagen zu gesellschaftlichen Entwicklungen 
nicht wie versprochen und erwartet eintreten, die Eintrittswahrscheinlichkeit 
P(Siegeszug der Digitalisierung) mit kleiner als 1 belegt. Zumal an dieser 
Stelle noch vollkommen unreflektiert ist, wie konkret sich dieser Siegeszug in 
unterschiedlichen Sphären des öffentlichen und privaten Lebens manifestiert. 
Ohne hier schon zu viel vorwegzunehmen: Der vermeintliche Siegeszug — so 
es denn einer sein sollte — ist auch immer wieder gespickt mit vielen kleinen 
negativen Auswirkungen für die Menschen in ihren Rollen als Bürger*innen, 
Arbeitnehmer*innen und Konsument*innen, wie nachfolgend an etlichen Stellen 
diskutiert wird. Das letzte Wort der zukünftigen Entwicklung von Digitalisierung 
in der digitalen Gesellschaft ist noch nicht gesprochen und Erfolgsverkündungen 
sind zu früh. Nun zeigt der Blick auf die Forschung auch, dass selbst das Nicht- 
Eintreten von Vorhersagen nicht automatisch zu erdrückenden Zweifeln an einer 
Idee führen muss, sondern häufig das Gegenteil bewirkt (Festinger et al., 1964). 
Mit anderen Worten: Auch wenn objektiv nicht von einem umfassenden Erfolg 
der Digitalisierung gesprochen werden kann, so sagt das noch lange nichts über 
den subjektiven Eindruck und dessen Bewertung aus. 

Ohne jedoch hier schon auf eine mögliche Beantwortung der Fragen hinzu- 
wirken, welche konkreten gesellschaftlichen Auswirkungen Digitalisierung zeitigt 
und ob und warum sie von der Bevölkerung als eine positive oder negative Ent- 
wicklung bewertet wird sowie welche Hoffnungen sich mit ihr für die Zukunft 
verbinden (siehe hierzu die Kapitel 4 und 5), soll zunächst folgende These auf- 
gestellt werden: Digitalisierung ist mit Blick auf die mannigfaltige Verwendung 
des Begriffs im Alltag, in den Medien, in Wahlkämpfen und in der Wirtschaft 
eine derzeit wirkmächtige Idee. Sie nährt sich aus vielfach formulierten Erwar- 
tungen bezüglich der Konsequenzen bspw. der digitalen Schule, Verwaltung 
oder Gesundheitsversorgung, neuer Wirtschaftszweige und gänzlich veränderter 
Medien- und Informationsnutzung. 

Der öffentliche Diskurs über die Digitalisierung und ihre spezifische Aus- 
gestaltung, bspw. in Form des Phänomens Big Data, hat einen Einfluss darauf, 
was Menschen bei Fragen der Digitalisierung denken und wie sie sich zu diesen 
verhalten (Knorre et al., 2020). Analog zu theoretischen Überlegungen der Kul- 
tivierungsanalyse (Gerbner, 1973; Gerbner et al., 1980; Gerbner, 1998; Morgan, 
2008) erfolgt hier eine in dieser Arbeit nachfolgend zu skizzierende Realitäts- 
beschreibung des Wesens und der Konsequenzen von Digitalisierung. Indivi- 
duum und Gesellschaft evaluieren und lernen im Rahmen dieser öffentlichen 
kommunikativen Verhandlung laufend und langfristig, welchen vermeintlichen 
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Entwicklungsstatus die digitale Gesellschaft hat und welchen mutmaßlichen Ent- 
wicklungsverlauf sie nimmt. Dabei formen sich in einem Prozess aufeinander 
aufbauender und miteinander verwobener Rezeptions- und Wirkungsereignisse 
insbesondere massenmedial geprägte Realitätskonzeptionen (Fahr & Früh, 2011; 
Früh, 1991; Früh & Schönbach, 1982; Gerbner, 1973; McQuail & Windahl, 
1993). Diese Realitätskonzeptionen sind also vor dem Hintergrund eines viel- 
schichtigen öffentlichen Diskurses zu bewerten, aus dem sie sich speisen, in den 
sie jedoch auch wieder zurückwirken, wobei sich wechselseitige Transformati- 
onsprozesse einstellen. 

In diesem Diskurs spielen — weit oberhalb des täglichen Klein-Kleins aktueller 
Geschehnisse — übergeordnete Gegenwartsdiagnosen eine zentrale und gewichtige 
Rolle für das Selbstverständnis einer Gesellschaft. Sie prägen als ausformulierte 
Erzählung einer gesamtgesellschaftlichen Selbstreflexion eine zeitgenössische 
Haltung, die sich im alltäglichen Handeln in den Sphären des öffentlichen und 
privaten Lebens niederschlägt. Die bereits angesprochene digitale Gesellschaft 
ist eine solche verhältnismäßig junge Gesellschaftsdiagnose. Sie erwächst jedoch 
einer weitaus allgemeineren Konzeption gesellschaftlicher Verfasstheit, die einen 
konkreten Bezug auf das epistemische Selbstverständnis des Menschen hat, in 
dessen Rahmen Digitallogik und Digitaltechnik eine maßgebliche und unverzicht- 
bare Bedeutung für das Entstehen von Erkenntnis besitzen, jedoch auf den ersten 
Blick lediglich einen funktionalen Charakter innehaben (Nassehi, 2019). Gemeint 
ist die Zeitdiagnose der Wissensgesellschaft (Kübler, 2009; Stehr, 2012, 2017), 
auf die nachfolgend einzugehen ist (siehe Abschnitt 4.2). In ihrem Rahmen wird 
Wissen in einen Stand erhoben, der die faktische jedoch auch imaginierte beson- 
dere Bedeutung von Wissen für die Gesellschaft hervorhebt. Wissen ist dann 
zentrale Kategorie, doch gleichzeitig auch ein abstrahiertes und theoriegelade- 
nes Konstrukt, über das gelernt und gewusst, diesbezüglich jedoch auch erwartet, 
gehofft und geglaubt werden kann (siehe Abschnitt 4.1). Es ergibt sich mithin 
abseits jeglicher tatsächlich manifestierter Konsequenz eine Erwartungshaltung, 
die auf die Wissensgesellschaft und das in ihr generierte Wissen gerichtet ist. 
Diese allgemeine Erwartungshaltung zielt dann auf die Idee der Wissensgesell- 
schaft ab, die zwar vielfach und immer anders nuanciert diskutiert wird, zu deren 
Kernbestand jedoch meist alle Innovationen und Artefakte aus dem Bereich der 
IuK zählen (Gerbner et al., 1973; Kübler, 2009). 


Digitale Daten als Kernelement der digitalisierten Wissensgesellschaft 

Die vorliegende Arbeit nimmt dabei nun den Verwertungszusammenhang digita- 
ler Daten in den Blick, die im Rahmen der fortschreitenden Digitalisierung bei der 
Verwendung eben jener IuK entstehen, und die gesellschaftliche Bedeutung dieser 
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Daten sowie öffentliche Erwartungen hinsichtlich Erkenntnis- und Nutzengewin- 
nen (Houben & Prietl, 2018; Knorre et al., 2020; Kolany-Raiser et al., 2018). 
Denn aus der Digitalisierung, die in ihrem Wesen aus einer Unterscheidung in 
Nullen und Einsen besteht, ergibt sich eine konstante und gewichtige Konse- 
quenz: Digitalisierung ist datengetrieben. Grund hierfür ist vor allem, dass die 
technische Möglichkeit der Feststellung und Übertragung realweltlicher Zustände 
in ein binäres digitales Format und dessen langfristige Speicherung Wissen über 
Zustände jenseits der Technik bereitstellt. Hieraus abgeleitete Erkenntnisse über 
die Welt können in vielfältigen sozialen Kontexten aufgegriffen, verwertet und 
genutzt werden und regen somit Anschlusshandlungen an. Daher sind digitale 
Daten, so eine weitere Prämisse der vorliegenden Arbeit, Ergebnis und gleich- 
zeitig Treiber der Digitalisierung der Gesellschaft in einem rekursiven Prozess. 
Dieser dehnt sich — nicht nur, weil es technisch möglich ist, sondern weil es 
gesellschaftlich befürwortet wird — auf immer mehr Lebensbereiche aus und 
führt zu sozialen Konsequenzen für Individuum und Gesellschaft. Die digitalen 
Daten sowie vor allem das auf ihnen aufbauende Wissen erfahren hierbei unter 
Stichworten wie Big Data, Datafizierung oder das auf Daten basierende Machine 
Learning (ML) und hiermit verbundener Erwartungen an Künstliche Intelligenz 
(KD derzeit eine hohe Aufmerksamkeit in öffentlichen Diskussionen der Sphären 
der Wissenschaft, der Wirtschaft und Politik sowie der Zivilgesellschaft (Finlay, 
2017; J. Kaplan, 2016; Katz, 2017; Knorre et al., 2020; Mayer-Schönberger & 
Cukier, 2013; O’Neil, 2017; Orwat & Schankin, 2018). 

Bevor jedoch auf die gesellschaftlichen Bedingungen und Erwartungen bezüg- 
lich der digitalen Datensammlung und -verwertung vor dem Hintergrund eines 
Erkenntnis- und Nutzengewinns eingegangen werden kann, ist zunächst Folgen- 
des zu klären: Was genau hat es mit digitalen Daten auf sich und in welchem 
Zusammenhang stehen sie zum Wissen? Was bedeutet hierbei überhaupt Wis- 
sen und welche Bedeutung hat es für Gesellschaft und Digitalisierung? Es wird 
daher im nachfolgenden Kapitel 3 zunächst einmal abgegrenzt, was unter digita- 
len Daten verstanden wird und welche Voraussetzungen und Konsequenzen mit 
ihrer Entstehung, Sammlung und Auswertung in technischer wie in sozialer Hin- 
sicht verbunden sind. Nach der Diskussion dieser vor allem sozio-technischen 
Voraussetzungen von digitalen Daten werden dann in Kapitel 4 das Wesen und 
die Bedeutung des Wissens in den Blick genommen, das auf Grundlage digi- 
taler Daten gewonnen werden kann. Erst im Anschluss kann sich der Analyse 
der sozialen Bedeutung von Big Data und Wissen für die digitalisierte Gesell- 
schaft vor dem Hintergrund aktueller gesellschaftlicher Entwicklungen gewidmet 
werden. 
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Digitale Daten und Big Data 3 


Um die Bedeutung digitaler Daten im sozialen Kontext der Digitalisierung nach- 
vollziehen zu können, muss nun zunächst ein grundlegendes Verständnis dafür 
hergestellt werden, was Daten und insbesondere digitale Daten ausmacht sowie 
warum im Kontext digitaler Daten oft von Big Data die Rede ist.! Dabei steht 
zunächst erst einmal die eher technische Definition von Daten im Vordergrund. 
Doch bereits bei Betrachtung dessen, was gemeinhin unter Big Data verstan- 
den wird, wird in der Literatur die rein technische Abgrenzung aufgeweicht 
und auch um sozio-technologische Aspekte der großen digitalen Datenbestände 
erweitert. Diese Erweiterung der Perspektive auf digitale Daten bringt, wie zu 
zeigen sein wird, eine Einbettung in den sozialen Kontext also zwingend mit 
sich, in dem Big Data mithin immer auch als ein sozio-technisches Phänomen 
verstanden werden müssen. Das liegt auch daran, dass die gängigen Definitionen 
von Big Data immer auch mit Blick auf ihren Ursprung im Verwertungskontext 
in Wissenschaft und Wirtschaft zu verstehen sind; zwei Bereiche menschlichen 
Lebens, die fest im zivilisatorischen Fundament verankert sind und ohne Mensch 
und Gesellschaft nicht denkbar wären. Die nachfolgenden Abschnitte legen somit 
den Grundstein für ein umfassendes Verständnis des Phänomens Big Data, das 


! Dabei sind die Bedeutung und insbesondere das Verhältnis der drei nachfolgend behan- 
delten Konstrukte der Daten, der Informationen und des Wissens sehr vielfältig gelagert 
und je nach eingenommener Perspektive nicht trennscharf zu unterscheiden. Daher wird an 
den entsprechenden Stellen auf weiterführende Literatur zur ideengeschichtlichen Ausein- 
andersetzung mit den jeweiligen Begrifflichkeiten verwiesen. Bezüglich der vorliegenden 
Ausführungen kann es daher jedoch immer nur um ein Arbeitsverständnis der Definitionen 
gehen, das primär auf die wesentlichen Charakteristika von Informationen, Daten und Wis- 
sen vor dem Hintergrund ihrer Bedeutung für den vorliegenden Forschungszusammenhang 
abstellt. 
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nötig ist, um anschließend den Blick auf die soziale Logik der Datensamm- 
lung und -auswertung zu richten. Folglich wird in Abschnitt 3.1 zunächst einmal 
ein allgemeines Verständnis von (digitalen) Daten im Sinne dieser Arbeit her- 
gestellt. In Abschnitt 3.2 wird anschließend der Zusammenhang zwischen der 
Entstehung, Speicherung und Auswertung der Daten unter den Vorzeichen digi- 
taler Umwandlung und Dokumentation auf Speichermedien erläutert, die dann 
mit Hilfe von IuK eingesehen und bearbeitet werden können. Diese Vorausset- 
zung digitaler Datenerzeugung und -speicherung ist der Ausgangspunkt für eine 
tiefergehende Betrachtung des Ausmaßes und der Besonderheiten der Datenak- 
kumulation, die unter Big Data verstanden wird und deren Einbettung in einen 
sozialen Zusammenhang dann Gegenstand der Abschnitte 3.4 bis 3.6 ist. 


3.1 Der Datenbegriff 


Wenn man Big Data beim Wort nimmt, dann geht es vordergründig anschei- 
nend einfach nur um große Mengen an Daten. Kein direkter Hinweis findet sich 
zunächst zum Informationscharakter, zur Digitalität oder gar zu Techniken der 
Informationsverarbeitung mit Hilfe von Computern; keine Antworten darauf, wes- 
sen Daten gemeint sind, wie diese entstehen und wo und wie diese gespeichert 
werden sowie ob und wie sie einer wie auch immer gearteten Weiterverarbei- 
tung zugeführt werden. Bevor diese Fragen adressiert werden können, ist an 
dieser Stelle daher zunächst zu erörtern, was genau eigentlich unter Daten zu 
verstehen ist, wobei die beiden zentralen Kriterien des Bedeutungsgehalts und 
des Bedeutungsbezugs des Datenbegriffs in dieser Arbeit im Mittelpunkt stehen 
und nachfolgend anschaulich einführt werden sollen. 


Der informative Bedeutungsgehalt von Daten 

Man könnte sich für ein erstes, recht basales — und wie gleich auch deutlich wer- 
den wird — verkürztes Verständnis von Daten zunächst einfach vorstellen, dass 
man sich in einem großen Raum befindet, mit vielen Schränken ähnlich einer 
Bibliothek, in denen Ordner stehen, worin sich wiederum viele Blätter Papier 
befinden, die jeweils mit Text oder auch einfach nur Buchstaben, Zahlen oder 
unbekannten Symbolen bedruckt sind. Wichtig ist dabei jedoch folgendes erstes 
Charakteristikum, das diese Zeichen zu Daten im Sinne dieser Arbeit macht: 
Den Angaben, die als Buchstaben, Zahlen oder anderweitigen Symbolen auf 
dem Speichermedium Papier festgehalten sind und hierbei zunächst lediglich 
jenen Symbolcharakter haben, kann eine Bedeutung zugewiesen werden, auf deren 
Grundlage Unterscheidungen getroffen werden können. Sie stellen für Mensch 
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(und auch für Maschine) daher mit Sinn behaftete, bedeutungsvolle Informatio- 
nen über einen Zustand bereit (Gleick, 2012).” Es kann dann dahingehend davon 
ausgegangen werden, dass man die dokumentierten Symbole versteht (bzw. prin- 
zipiell verstehen könnte), also um die Bedeutung der Zeichen wissen kann und 
diese nun nutzen kann, indem man sie einer kognitiven oder bei einem Com- 
puter eben maschinellen Verarbeitung zuführt, die auf Grundlage einer durch 
diese Daten getroffenen Unterscheidung operiert. Daten haben mithin zunächst 
ein Bedeutungspotential. 

Wenn eine Ärztin stündlich festhält, wie sich die Fiebertemperatur eines 
Patienten entwickelt, beobachtet und dokumentiert sie von einem Thermometer 
abgelesene Daten über dessen Zustand. Mit Blick auf die informative Bedeu- 
tung dieser Daten besitzt die Ärztin nun Anhaltspunkte über den Status und 
die Entwicklung des Gesundheitszustands eines Patienten und kann zwischen 
gesund oder krank unterscheiden sowie im Zeitverlauf zwischen einer gesund- 
heitlichen Verbesserung oder Verschlechterung und weiß so um die spezifische 
Bedeutung der so getroffenen Unterscheidungen. In Rahmen dieses Beispiels 
wird neben dem Potential der Bedeutung von Daten dabei ein weiteres essentiel- 
les Charakteristikum für den Datenbegriff eingeführt, das weithin als konstitutiv 
angenommen wird: Daten sind diesem Beispiel folgend dokumentierte Beobach- 
tungen von Tatsachen über die Welt und weisen somit auf den spezifischen Bezug 
des Bedeutungsgehalts festgehaltener Symbole hin. 


Der Bedeutungsbezug von Daten 

Unter dem Begriff Daten werden laut Duden auch ganz allgemein „Beob- 
achtungen, Messungen, statistischen Erhebungen“ (Kunkel-Razum et al., 2017) 
subsumiert. Wenn nachfolgend nun von Daten und insbesondere digitalen Daten 
gesprochen wird, dann wird der Datenbegriff in eben diesem Sinne der mani- 
fest dokumentierten Beobachtung von Tatsachen verstanden. Da jedoch auch 
ein Musikstück oder ein Video in digitaler Datenform vorliegen kann, wird 
bereits an dieser Stelle deutlich, dass es unterschiedlich weit gefasste Daten- 
begriffe geben kann: Einen weitreichenden Datenbegriff, der allein auf die 
technisch-materielle Dokumentationsform abstellt und mithin bspw. auch kul- 
turelle Produkte umschließt, die in Datenform vorliegen, sowie einen engeren 


2 Schon an diesem Beispiel wird deutlich, dass nicht automatisch von Daten auf Informa- 
tion und Wissen geschlossen werden kann. Daten, in ihrem Wesen bis hier nun lediglich 
verstanden als Symbole, können Informationen für Mensch und/oder Maschine sein, müssen 
dies jedoch selbstredend nicht zwingend für jeden Menschen und jede Maschine sein und sie 
führen somit nicht auch automatisch zu Wissen. 
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Datenbegriff, der empirisch zu verstehen ist und speziell auf Beobachtungs- 
daten rekurriert. Wenn nicht anders genannt oder hervorgehoben, wird dabei 
meistens diesem engen Datenbegriff gefolgt, wenn nachfolgend von Daten in die- 
sem forschungsempirischen Sinne die Rede ist. Doch auch ein weitreichenderer 
sozio-technischer und kultureller Datenbegriff wird in den folgenden Ausfüh- 
rungen immer dort relevant, wo es um die soziale Bedeutung von Digitaldaten 
geht. Dabei ist der Datenbegriff dann nicht beliebig gewählt, sondern in seiner 
vielschichtigen Bedeutung der Bezugspunkt eines besseren und umfassenden Ver- 
ständnisses des Phänomens Big Data, das sowohl die Gesellschaft betreffen kann 
(Kolany-Raiser et al., 2018) als auch die eigentliche Forschungsbeschäftigung 
und ein empirisches Wissenschaftsverständnis umfasst (boyd & Crawford, 2012; 
Mahrt & Scharkow, 2013). 

Es gibt viele Lebensbereiche, in denen vor allem jene Beobachtungsdaten 
eine immense Bedeutung innehaben, so etwa in der Medizin, im Staatswesen, 
selbstverständlich in der Wirtschaft und insbesondere auch in der Wissenschaft 
(Cohen, 2006; Crook & O’Hara, 2011; Hacking, 1990; MacKenzie, 1981; Т. 
M. Porter, 2011). Man erhält so bspw. durch Daten über die wirtschaftliche 
Güter- und Dienstleistungsproduktion eines Landes einen Einblick in die Ver- 
fassung seiner Ökonomie. Ganz gleich, ob die Speicherung bereits für einen 
gezielten Verwertungszweck geschieht oder die Daten als Nebenprodukt anfal- 
len: Die andauernde Dokumentation, das Festhalten dieser Daten auf einem 
Speichermedium meint Datenspeicherung und ist somit das Ergebnis fortlaufend 
festgehaltener Beobachtungen. An diese Speicherung kann dann eine Weiterverar- 
beitung anschließen, diese muss jedoch nicht zwingend stattfinden. Erfolgt bspw. 
eine Auswertung der Daten, meint dies oft, jedoch nicht zwangsläufig, dass sta- 
tistische Zusammenhänge in den Daten aufgezeigt werden und unterschiedliche 
Daten miteinander in Beziehung gebracht werden. Viel wichtiger ist zunächst 
jedoch das zuvor erwähnte Moment der Bedeutungsfeststellung auf Grundlage 
der Beobachtungsdaten, denn diese Bedeutungszuschreibung stößt wiederum wei- 
tergehende Handlungsentscheidungen an (Cohen, 2006; T. M. Porter, 2011; 
Rieder & Simon, 2016). Mit Bezug auf das eingangs eingeführte Beispiel dia- 
gnostiziert die Ärztin aus dem Ansteigen der Fieberkurve des Patienten eine 
Verschlimmerung des Krankheitsverlaufs und sieht sich zu einer Maßnahme wie 
der Gabe eines fiebersenkenden Medikaments veranlasst. 
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3.2 Daten und Daten-Speichermedien 


Die Speicherung von Daten funktioniert wie im Falle aller menschlich geschaffe- 
nen Symbole mit Blick auf die Menschheitsgeschichte zunächst vor allem durch 
Festhalten von Informationen auf Papier oder anderen ‚analogen‘ Speichermedien 
(Faulstich, 2006). So wurden in der Schifffahrt Logbücher geführt (Cohen, 2006), 
in denen allerlei wichtige und nebensächliche Informationen zu Beschaffenheit 
von See und Schiff dokumentiert sind. Die analoge Speicherung der Daten auf 
in Aktenordnern gesammelten und verwahrten Unmengen von Papier ist dabei 
auch weiterhin recht gebräuchlich, wird jedoch nunmehr ergänzt um die digitale 
Speicherung von Daten. 

Ausgehend von Claude Shannons Arbeiten zu einer mathematischen Theo- 
rie von Kommunikation (Shannon, 1948) bekam der bis dato unscharfe Begriff 
der Information eine zählbare Form und wurde forthin quantifizierbar (Shan- 
non & Weaver, 1949). Shannon war somit der Wegbereiter einer neuen Sicht 
auf Information (Gleick, 2012), prägte hierbei den Begriff Bit und ebnete 
damit der bis heute gebräuchlichsten Ausdrucksweise von Daten den Weg: binär 
codierte Sequenzen von Zustandsbeschreibungen, ausgedrückt in 1 oder 0. Er 
legte den konzeptuellen Grundstein für das, was heutzutage weithin unter digita- 
ler IuK verstanden wird (Guizzo, 2003). Denn gegen Mitte des 20. Jahrhundert 
bestand nunmehr auch die Möglichkeit, Informationen auf digitalen Speicherme- 
dien festzuhalten (Ceruzzi, 2003). Dies führt in Kombination mit Computern, 
die jegliche Informationen als binär codierte Sequenzen in den digitalen Spei- 
cher schreiben und weiterverarbeiten, durch industrielle Massenfertigung zu 
einem explosionsartigen Anstieg von verfügbaren Datenträgern und Datenver- 
arbeitungsanlagen (Berkeley, 1949; Ifrah, 2001). Daten können nun maschinell 
und fortlaufend ohne menschliches Zutun automatisiert erhoben und darüber hin- 
aus schnell vervielfältigt werden (Chun & Soderman, 2008; Storsul & Fagerjord, 
2008). Informationsverarbeitende IuK, allen voran ebenjener Computer, werden 
innerhalb weniger Jahrzehnte zentraler Bestandteil menschlicher Gesellschaf- 
ten. Die zunehmende Nutzung von IuK in unterschiedlichen Lebensbereichen 
bringt immer auch die Möglichkeit der begleitenden Speicherung und Doku- 
mentation dieser Nutzung mit sich. Wo immer Computertechnik zum Einsatz 
kommt, fallen nun Digitaldaten an. Aufgrund der fortschreitenden Verbreitung 
digitaler Medientechnologien wie Laptops, Computer und Smartwatches bezeich- 
nen McAfee und Brynjolfsson (2012) den Menschen, der diese Technologien 
nutzt, auch als „Walking Data Generator“. Zudem entstehen beim computeri- 
sierten Zugriff auf digitale Daten erster Ordnung zusätzlich neue digitale Daten 
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zweiter Ordnung, sogenannte Meta-Daten (Pomerantz, 2015). Neben der Spei- 
cherung großer Datenmengen erlauben Computer zudem auch die regelgeleitete 
Weiterverarbeitung und Analyse der Daten. Moderne Prozessoren, bezeichnender- 
weise auch Rechner genannt, erlauben mannigfaltige statistische Auswertungen 
und Datenverarbeitung, wobei die Daten erster und zweiter Ordnung immer wie- 
der zusammengefasst und transformiert werden können. Die Möglichkeit, die 
Vielzahl an Daten auf digitalen Speichermedien festzuhalten und von hier Tech- 
niken der Informationsverarbeitung zuzuführen, legen den Grundstein für das, 
was mittlerweile gemeinhin unter dem Begriff Big Data verstanden wird, einem 
Phänomen, bei dem also Daten unter dem Vorzeichen der Digitalisierung in 
großen Mengen anfallen und produziert werden können. An der Schwelle zum 
21. Jahrhundert verdoppeln sich jedes Jahr allein die weltweit verfügbaren wis- 
senschaftlichen Daten (Szalay & Gray, 2006), so dass sinnbildlich von einer 
Datenflut (engl. ‚Data Deluge‘) gesprochen wird (C. Anderson, 2008; G. Bell 
et al., 2009). 

Die vorhergehenden Ausführungen dienen zunächst einmal einem Grund- 
verständnis für das, was gemeinhin unter Daten zu verstehen ist und wieso 
insbesondere die Digitalisierung die Entstehung, Speicherung und Auswertung 
der Daten begünstigt und zu immer größer werdenden Datenbeständen führt. 
Hieraus lässt sich jedoch noch nicht ableiten, warum genau diese Daten nun 
gerade eine so große gesellschaftliche Beachtung erfahren und ihnen eine 
immense Bedeutung zugeschrieben wird, sie gar zu einer neuen Leitwährung 
stilisiert werden. Hierzu bedarf es einer weitergehenden Betrachtung der Cha- 
rakteristika und hieraus abgeleiteter Potentiale der Sammlung und Verwertung 
großer digitaler Datenbestände, die auch als Big Data bezeichnet werden. 


3.3 Von digitalen Daten zu Big Data 


Die Erläuterung des Wesens von Daten im vorigen Abschnitt, vor allem mit 
Blick auf die Besonderheiten digitaler Daten und den Voraussetzungen und Mög- 
lichkeiten ihrer informationstechnischen Verarbeitung, erlaubt nun den Blick auf 
das Phänomen Big Data zu richten. Big Data nimmt seinen Ausgangspunkt 
in der vorrangigen Digitalität von Daten im Zuge der Mitte des 20. Jahr- 
hunderts beginnenden, eingangs beschriebenen Digitalisierung und der hiermit 
einhergehenden Verbreitung von Computertechnologie (Ceruzzi, 2003; Rid, 2017; 
Wittpahl, 2017). 
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Eine der wichtigsten Vorbedingungen fiir die vermeintliche Explosion an 
Daten ist jedoch insbesondere das Internet, das eine Vernetzung zwischen Schnitt- 
stellen der IuK und den dezentralen Austausch digital codierter Information 
ermöglicht. Entsprechend definieren В. М. Leiner et al. (2009) auch wie folgt: 
“The Internet is at once a world-wide broadcasting capability, a mechanism for 
information dissemination, and a medium for collaboration and interaction bet- 
ween individuals and their computers without regard for geographic location” 
(S. 23). Als technische Infrastruktur, die aus dem militärischen und wissen- 
schaftlichen Kontext entstammt und von der Advanced Research Projects Agency 
(ARPA) des US-amerikanischen Verteidigungsministeriums vorangetrieben wurde 
(Belfiore, 2009), hat sich das Internet ab Ende des vergangenen Jahrtausends 
weltweit in immer mehr Lebensbereichen fest etabliert. Bedingt durch die techni- 
sche Infrastruktur des Internets in Kombination mit anderen IuK werden laufend 
und global Unmengen von digitalen Daten erzeugt, verteilt und weiterverarbeitet 
(Pentland, 2014; Stephens-Davidowitz, 2017). Zum Beispiel werden heutzu- 
tage in so gut wie allen Bereichen des privaten und beruflichen Alltags ШК 
genutzt, die stetig mit dem Internet verbunden, also online sind. Was mit statio- 
nären Computern mit Online-Zugang begann, setzt sich mit dem weitreichenden 
Gebrauch von Smartphones fort. Im Jahr 2018 nutzen 57 Millionen Menschen 
in Deutschland solch ein Gerät, das man fast überall hin mitnehmen kann und 
das jederzeit mit dem Internet verbunden ist (Statista, 2018c). Mit diesem kann 
man mittlerweile nicht mehr nur telefonieren und Nachrichten austauschen (Geb- 
hardt, 2008), sondern auch Musik hören, Fotos machen und auf einen globalen 
Informationsspeicher zugreifen. 

Nach und nach werden in einem Zusammenspiel kabelloser und miteinander 
vernetzter Sensorik immer mehr Alltagsgegenstände wie bspw. Haushaltsgeräte 
‚online‘ sein und zusätzliche Funktionen und Informationen bereitstellen, für die 
eine stetige Verbindung zur zuvor beschriebenen technischen Infrastruktur des 
Internets gegeben sein muss. Diese Entwicklung aus der IuK, bei der Compu- 
tertechnik allzeit online ist, wird auch als Internet der Dinge (engl. Internet of 
Things — IOT) bezeichnet (Ashton, 2009; Gubbi et al., 2013). Hierunter fallen 
Kühlschränke und Heizungssysteme, die mit dem Internet verbunden sind und 
über dieses, insbesondere via Smartphone, aus der Ferne gesteuert werden kön- 
nen, Befehle empfangen oder versenden können. Die vermeintlichen Vorzüge 
dieser Vernetzung und den sich hieraus ergebenden Steuerungs- und Opti- 
mierungsmöglichkeiten werden unter dem Stichwort Smart Home angepriesen 
(Harper, 2003). Es wird alleine hierdurch deutlich, dass die stetige Online- 
Konnektivität technischer Endgeräte und ihrer Sensorik sowie der laufende 
Kommunikationsaustausch dieser Geräte untereinander und mit den Nutzer*innen 
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das Ausmaß der digitalen Datenentstehung weiter befeuern wird. Folglich gibt es 
etliche weitere Anwendungsfelder und Verwendungsmöglichkeiten des IOT und 
laufend kommen neuen Online-Innovationen hinzu (Li et al., 2015). Dies sind nur 
einige von vielen Beispielen, um zu demonstrieren, in welchem Umfang digita- 
lisiert wird und bei der Nutzung digitaler Medien automatisiert Daten entstehen 
(Kolany-Raiser et al., 2018; Wittpahl, 2017). Die Automatisierung der Datenerhe- 
bung wird dabei bspw. direkt handlungsrelevant beim Aufzeichnen, Analysieren 
und Reflektieren von und über Daten, die man im Rahmen des Self-Tracking, 
zur Selbstbeobachtung und -vermessung des eigenen Gesundheitszustands über 
sich selbst gesammelt hat (Gilmore, 2016; Nafus & Sherman, 2014; Neff & 
Nafus, 2016). Sie kann sich jedoch auch indirekt bemerkbar machen, etwa, wenn 
datenbasiert Empfehlungen ausgesprochen werden und Entscheidungen abgenom- 
men werden, z. B. bei personalisierten Angeboten und zielgerichteter Werbung, 
die durch Algorithmen des maschinellen Lernens möglich werden (Beer, 2017; 
Mohabbat Kar et al., 2018). 

Eine ausführliche Betrachtung des Phänomens Big Data und der Beschrei- 
bungsdimensionen, die in der Literatur verwendet werden, legt somit den 
Grundstein für ein umfassendes Verständnis für die technischen Grundlagen 
eines zu beschreibenden Mythos Big Data und des sich hieraus gespeisten 
Glaubenssystems in Bezug auf Big Data, die insbesondere auf die Erwartun- 
gen an Erkenntnis- und Nutzengewinn von Big Data abstellen. Hierbei ist trotz 
der weit zurück zu verfolgenden historischen Entwicklungslinie bereits an die- 
ser Stelle anzumerken, dass Begriff, Verständnis und Bedeutung von Big Data 
selbst noch recht jung sind, es zwar keine etablierte Definition, jedoch durch- 
aus definitorische Übereinstimmungen gibt. Erste Definitionsansätze sind durch 
die Entwicklungsdynamiken im Zuge der Digitalisierung folglich noch flexi- 
bel und dehnbar. Der folgende Abschnitt nähert sich einer Arbeitsdefinition der 
essentiellen Wesensmerkmale von Big Data, die Grundlage für die auszuarbei- 
tende Betrachtung von durch Digitalisierung begünstigter Quantifizierung der 
Gesellschaft und insbesondere hiermit verbundenem Wissenszugewinn und indi- 
viduellem und gesellschaftlichem Nutzen sein soll. Mit Bezug auf akademische 
Literatursynthesen und Überblicksartikel wird für diesen Abschnitt eine Auf- 
teilung der Literatur nach Beschreibungsschwerpunkten vorgenommen (Mauro 
et al., 2016). Abschnitt 3.4 beschäftigt sich daher zunächst mit den technischen 
Beschreibungsdimensionen von Big Data. Hierauf folgend wird auf die sozio- 
technischen Konsequenzen eingegangen und insbesondere das Neuartige an Big 
Data in den Vordergrund gestellt (Abschnitt 3.5). Da Big Data eines von etlichen 
Schlagworten ist, welches sich derzeit in der öffentlichen Debatte wiederfindet, 
soll abschließend in Abschnitt 3.6 auf verwandte Phänomene und Entwicklungen 
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eingegangen werden, in deren Rahmen Big Data eine gewichtige Einflussgröße 
oder wie beim maschinellen Lernen gar eine Grundbedingung darstellen. Ausge- 
hend von dem dann gelegten sozio-technischen Verständnis von Big Data kann 
schließlich deren soziale Bedeutung für einen Erkenntnis- und Nutzengewinn 
näher erläutert werden. 


3.4 Technische Charakteristika und 
Beschreibungsdimensionen von Big Data 


Eine der ersten Definitionen, ohne dass diese bereits von Big Data gesprochen 
hat, geht auf einen Gartner-Report von Laney (2001) zurück, in dem dieser drei 
mit V beginnende Beschreibungsdimensionen, namentlich Volume, Velocity und 
Variety (übersetzt als: Volumen, Geschwindigkeit und Vielfalt} einführt, die die 
großen Datenmengen charakterisieren, die im Zuge der Digitalisierung fortlau- 
fend entstehen. In der Tradition dieser Alliteration kamen über die Zeit viele 
weitere mit dem Buchstaben V beginnende Beschreibungsdimensionen hinzu, die 
auf unterschiedliche Charakteristika der Datenmengen abstellen (Diebold, 2012). 
Allerdings lässt sich eine weitläufige Verbreitung des Begriffs erst ab 2010 fest- 
stellen (Gandomi & Haider, 2015). Während es je nach Betrachtung also etliche 
zu unterscheidende Beschreibungsdimensionen gibt und mitunter über die exakte 
Definition von Big Data gestritten wird (Kitchin & McArdle, 2016), beschränken 
sich die nachfolgenden Ausführungen auf die eingangs erwähnten eher deskrip- 
tiven Dimensionen Volumen, Geschwindigkeit und Vielfalt sowie insbesondere 
auf die in der Literatur für den Verwertungszusammenhang der Daten hervor- 
gehobenen zentralen Dimensionen Veracity und Value. Während die deskriptiven 
Dimensionen die Daten an sich beschreiben, haben die beiden letztgenannten 
Dimensionen einen eher sozio-technisch bedeutsamen Charakter, der insofern auf 
die Qualität von großen digitalen Datenbeständen abstellt, indem deren erwarteten 
Konsequenzen für Erkenntnis- und Nutzengewinn evaluiert werden (H. Chen & 
Yan, 2016; Gandomi & Haider, 2015; Wiencierz, 2016). Letztere werden nach- 
folgend auch als Richtigkeit und Nutzen bezeichnet (siehe Abschnitt 3.5.1 und 
Abschnitt 3.5.2). 

Es bedarf dabei in den folgenden Kapiteln zunächst der Definition der ein- 
zelnen Charakteristika von Big Data, um hiervon ausgehend deren jeweilige 


3 Für eine bessere Verständlichkeit der folgenden Ausführungen werden die jeweiligen V- 
Dimensionen übersetzt und es werden im weiteren Verlauf der Arbeit die deutschen Begriffs- 
verwendungen verwendet. 
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Bedeutung für eine Betrachtung der sozialen Dimension des Phänomens zu erläu- 
tern. Dabei werden zu Illustrationszwecken und für ein besseres Verständnis auch 
einige prominente Beispiele zum Anwendungskontext von Big Data eingebracht. 
Für weitere Beispiele zu Anwendungen und Einsatzpotential von Big Data sei an 
dieser Stelle stellvertretend auf die Ausführungen von Mayer-Schönberger und 
Cukier (2013), O’Neil (2017), Rudder (2014) und Stephens-Davidowitz (2017) 
verwiesen. 


3.4.1 Das Volumen digitaler Datenentstehung und 
-verwertung 


Das Volumen (Volume) digitaler Datenentstehung und -verwertung betrifft das 
Ausmaß oder die Größenordnung der Datenmengen, die sich nicht nur einfacher 
Datenspeicherung und -analyse, sondern oft auch der menschlichen Vorstellungs- 
kraft entziehen. “The term ‘Big Data’ suggests that size is its key feature” (Lyon, 
2014, S. 5). Wie zuvor beschrieben wurde, fallen in nahezu allen Lebensbereichen 
und insbesondere immer dort digitale Daten an, wo Technologien der digita- 
len Informationsverarbeitung Anwendung finden. So werden bspw. am European 
Bioinformatics Institute und auch dem CERN, einer europäischen Forschungs- 
einrichtung im Bereich der Teilchenphysik, mittlerweile Petabyte* an Daten 
gespeichert — das Tausendfache einer handelsüblichen Festplatte (Marx, 2013). 
Basierend auf einer Analyse von Suchmaschinen wird die derzeitige Größe der 
im indizierten Internet erreichbaren Webseiten mit 4,47 Milliarden Einträgen 
angegeben (van den Bosch et al., 2016; WorldWideWebSize, о. D.). Doch auch 
bereits vorhandene analoge Daten, die in den Jahrhunderten vor der Digitali- 
sierung entstanden, werden zunehmend in digitale Daten überführt. Das Projekt 
Google Books hat seit seiner Entstehung 2004 bis zum Jahr 2015 rund mehr als 25 
Millionen der weltweit geschätzt 130 Millionen verfügbaren Bücher digitalisiert 
(Heyman, 2015; Taycher, 2010). 

Diese Zahlen stehen hier illustrativ für die große Menge an Daten, die die 
Menschheit fortlaufend erzeugt. Die Beschreibungsdimension Volumen — die im 
Folgenden auch als Ausmaß der Datenerzeugung und -speicherung umschrieben 
wird — ist folglich jene Eigenschaft, die wohl den meisten Menschen in den Sinn 
kommt, wenn es um Big Data geht. Es gibt keinen Zweifel daran, dass man es 
im Rahmen von Big Data mit einer Unmenge an Daten zu tun hat, auch wenn in 
der Literatur vereinzelt angezweifelt wird, dass nur große Datensätze Big Data 


4 Ein Petabyte sind 10!> Bytes oder auch eine Million Gigabyte. 
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sein können und es keine verbindliche Grenze gibt, ab wann ‚kleine‘ oder ver- 
meintlich ‚normal große‘ Datensätze zu Big Data werden (Kitchin, 2014). Dass 
mit Blick auf eine konkrete Zahl an erhobenen Variablen oder Fällen kein Wert 
benannt werden kann, führt auch dazu, dass insbesondere auf die technischen 
Herausforderungen bei der Verarbeitung von Big Data als zentrale Konsequenz 
hingewiesen wird: 


The term Big Data has a relative meaning and tends to denote bigger and bigger data 
sets over time. In computer science, it refers to data sets that are too big to be handled 
by regular storage and processing infrastructures. (Mahrt & Scharkow, 2013, S. 22) 


Gleichzeitig bedeutet das auch, dass die Datenmengen so groß sind, dass kein 
Mensch sie selbst und unmittelbar verarbeiten kann, er also ohne technische 
Hilfsmittel nicht in der Lage ist, eine unmittelbare Bedeutung aus ihnen abzu- 
leiten. Schon hier wird deutlich, dass lediglich ein indirekter vermittelter Zugang 
zu den Daten bestehen kann, aus dem sich ein Verständnis dessen speist, was man 
in den Daten zu erkennen glaubt. Ein Datenleck, bei dem Millionen von vertrauli- 
chen Daten in die falschen Hände geraten, wird erst dann zu einer großen Gefahr, 
wenn diese Daten mit Computertechnik ausgewertet werden und ihnen so eine 
entsprechende Bedeutung zugeschrieben wird. 

Volumen als Charakteristikum von Big Data ist somit eine zentrale, jedoch 
eher deskriptive Dimension, die in so gut wie jeder Definition zu Big Data Erwäh- 
nung findet (Ylijoki & Porras, 2016).? Zu den weiteren überwiegend deskriptiven 
Beschreibungsdimensionen zählen Velocity (Geschwindigkeit) und Variety (Viel- 
falt), die nachfolgend erörtert werden. Diese beiden Dimensionen werden dann 
von den eher konsequentiell-evaluativen Dimensionen Veracity (Richtigkeit) und 
Value (Nutzen) abgegrenzt. 


3.4.2 Die Geschwindigkeit digitaler Datenentstehung und 
-verwertung 


Velocity ist gemeinhin als Geschwindigkeit zu übersetzen. Sie ist als eine weitere 
bedeutende Eigenschaft von Big Data zu verstehen, die jedoch eng mit dem Aus- 
maß der digitalen Datenbestände verknüpft ist. Dabei wird im Zusammenhang mit 
Big Data mit Blick auf die Geschwindigkeit über unterschiedliche Phänomene 
gesprochen, die voneinander getrennt betrachtet und erläutert werden müssen. 


5 So finden sich in über 95 % der Definitionen von Big Data eben jene Bezüge auf das 
quantitative Ausmaß der Daten (Ylijoki & Porras, 2016). 


28 3 Digitale Daten und Big Data 


Aufgrund des rekursiven Charakters des Datenverwertungsprozesses, bei dem im 
Rahmen der Datenentstehung und -verwertung neue sogenannte Meta-Daten pro- 
duziert werden, sind hier zwei Perspektiven zu unterscheiden, die jedoch eng 
miteinander verwoben sind. Laut Kitchin und McArdle (2016) handelt es sich 
hierbei mit Blick auf Geschwindigkeit von Big Data um: (1) “frequency of gene- 
ration” sowie (2) “frequency of handling, recording, and publishing” (S. 7). 
Zum einen spielt also Geschwindigkeit eine entscheidende Rolle im Entstehungs- 
kontext digitaler Daten, zum anderen kommt ihr in deren Verwertungskontext, 
insbesondere bei der Datenauswertung eine wichtige Bedeutung zu. 


Geschwindigkeit im Entstehungskontext der digitalen Daten 

Wie bereits in den vorangegangenen Abschnitten angesprochen und anhand eini- 
ger Zahlen illustriert, entstehen jede Sekunde Unmengen von digitalen Daten. 
Zeit spielt also im Entstehungskontext der Daten eine elementare Rolle, denn 
zu den Unmengen an bereits vorhandenen Daten kommen laufend neue hinzu. 
Es kann also bei Big Data keine umfassende Betrachtung des Phänomens erfol- 
gen, ohne sich die Zeitlichkeit als notwendige Komponente einer Definition vor 
Augen zu führen (Ylijoki & Porras, 2016). Allein die Nutzung von Online- 
Services durch Internetnutzer trägt zu einem beständig wachsenden Berg an 
digitalen Daten bei. Seiten wie Internet Live Stats®, die das Verhalten der Nut- 
zer und den dabei entstehenden Internetverkehr visualisieren, veranschaulichen 
dies eindrucksvoll. So werden weltweit jede Sekunde abertausende Bilder und 
Textbeiträge auf Internetserver hochgeladen, geteilt, bewertet und kommentiert. 
Nicht nur das Ausmaß der digitalen Daten ist also sehr groß, sondern auch die 
Geschwindigkeit, mit der die vielen Daten entstehen. Laut den Internet Live Stats 
sind das Stand Februar 2021 rund 112 Gigabyte — jede Sekunde. Dadurch fordert 
das Phänomen Big Data auch gängige Datenspeicherungsmöglichkeiten heraus. 
So haben die meisten Unternehmen mittlerweile entsprechende Kapazitäten auf- 
gebaut, um die bei der Verwendung ihrer Dienste anfallenden Daten zu speichern. 
Für das Jahr 2017 berichtet Thibodeau (2017) von weltweit 8,4 Millionen aktiven 
Rechenzentren, die im Englischen primär auch als Data Center bezeichnet wer- 
den und über deren Server und angeschlossene Glasfaserkabel die Datenströme 
des Internets laufen. Laut Koomey (2011) trugen diese Datenzentren Anfang des 
Jahrzehnts bereits mit über einem Prozent zum weltweiten Stromverbrauch bei, 
mit ansteigender Tendenz. Das bedeutet gleichzeitig, dass es — ähnlich wie in 
der Logik des dezentralen Internets — keine isolierte zentrale Instanz gibt, bei der 


6 http://www.internetlivestats.com/one-second/ 
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die online entstehenden digitalen Daten laufend erzeugt und gespeichert werden. 
Datenerzeugung ist auch daher ein globales Phänomen. 

Neben dieser räumlichen Dispersität der Daten sind die Datensätze, die 
unter Big Data verstanden werden, anders als es der Begriff andeutet, auch 
aus zeitlicher Sicht keine fertigen und abgeschlossenen Einheiten. Sie können 
sich stetig vergrößern oder aber bei versehentlichem Datenverlust oder aktiver 
Löschung’ verkleinern — was bei fortlaufender Analyse und der Interpretation 
ihrer Ergebnisse ebenfalls berücksichtigt werden muss. 


Geschwindigkeit im Analysekontext der digitalen Daten 

Wenn die Entstehung großer Datenmengen in Echtzeit zu verfolgen ist, dann hat 
das nicht nur Auswirkungen auf die Speicherung von Big Data, sondern weckt 
auch menschliche Begehrlichkeit, Erkenntnisse über diese Daten und aus diesen 
Daten in Echtzeit zu gewinnen (Kitchin, 2014; Mayer-Schönberger & Cukier, 
2013). Big-Data-Analysewerkzeuge müssen daher nicht nur in der Lage sein, 
digitale Daten zeitlich synchron einzulesen und zu speichern, sondern auch syn- 
chron und unmittelbar Erkenntnisse bezüglich eben jener Daten zu liefern, so 
dass aktuelle Trends und statistische Zusammenhänge in Echtzeit verfolgt wer- 
den können (Barlow, 2013; Vera-Baquero et al., 2016). Das sind zumindest die 
Erwartungen, die an Big Data gerichtet sind und die der Beschreibungsdimension 
Geschwindigkeit für den letztendlichen Nutzungskontext besondere Bedeutung 
verleihen. Es reicht nicht nur zu beobachten, dass sekündlich weltweit Men- 
schen tausende Fotos auf Facebook und Instagram hochladen. Es ist mit Blick 
auf das Versprechen von Big Data auch von Bedeutung, hieraus jetzt und sofort 
Erkenntnisse zu ziehen. Für den sozialen Kontext sollen u. a. folgende Fragen mit 
Hilfe von Sentiment-Analysen zur Stimmungserkennung von Personen beantwor- 
tet werden, die auf Big Data zugreifen (Bravo-Marquez et al., 2014; Liu et al., 
2013; Н. Wang et al., 2012): Was bewegt die Nutzer*innen bspw. gerade in 
ihrer Rolle als Bürger*innen? Welche Themen treiben die Öffentlichkeit um, wie 
sieht die öffentliche Meinung und ihre Verteilung aus? Welche Politiktreibenden 
fallen oder steigen gerade aus welchen Gründen in der öffentlichen Gunst? Die 
Möglichkeit solcher Analysen befeuern den Wunsch nach Big-Data-Kompetenzen 
und Auswertungskapazitäten, die in Echtzeit abgerufen werden können, da die 
Erwartung besteht, aus der unmittelbaren Vergangenheit und Gegenwart Erkennt- 
nisse über Weltzustände in der Zukunft zu gewinnen (Mayer-Schönberger, 2015; 
Obermeyer & Emanuel, 2016). 


7 Siehe hierzu bspw. die Diskussion um Datenlöschung im Rahmen des Rechts auf Verges- 
senwerden (Jandt et al., 2013; Koops, 2011; Rosen, 2012; Roßnagel, 2016). 
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3.4.3 Die Vielfalt digitaler Datenentstehung und -verwertung 


Ein weiteres Versprechen von Big Data ist, dass man mannigfaltige Erkenntnisse 
für alle vorstellbaren Lebensbereiche gewinnt, solange nicht nur punktuell viel, 
sondern am besten auch überall und für alles Mögliche entsprechend vielfäl- 
tige Daten gesammelt werden. Die Vielfalt (Variery) digitaler Datenentstehung 
und -verwertung rückt an späterer Stelle insbesondere im Kapitel 5 bei der 
fortschreitenden Quantifizierung des Sozialen in den Blick. Hier wird deutlich 
werden, dass mit Big Data die Hoffnung verbunden ist, für jeglichen Bereich 
des sozialen Miteinanders Erkenntnisse zu gewinnen, und daher in der Konse- 
quenz überall auch Daten gesammelt werden (Mau, 2017). Der Anspruch der 
Digitalisierung und ihrer digitalen Daten ist mithin auch, alles messen zu kön- 
nen (Hubbard, 2010). Die ubiquitäre Datensammlung geschieht daher nicht nur 
in Form der unterschiedlichen Kommunikationsmodi wie allen voran Text sowie 
Bild- und Audio-Dateien, die entstehen und bspw. über die Kommunikationsar- 
chitektur des Internets zwischen den Nutzenden ausgetauscht werden. Sondern 
diese unterschiedlichen Arten von Daten entstehen auch in immer neuen Kon- 
texten. Sensoren, die von Temperatur hin zu Bewegungen etc. alles Mögliche 
messen, befeuern die Vielfalt der entstehenden Daten und werden nicht nur 
in Automotoren und Flugzeugtriebwerken verbaut, sondern auch in Uhren, mit 
denen Menschen jederzeit ihre Schrittzahl oder den eigenen Puls nachverfol- 
gen können. Letzteres Beispiel nimmt Bezug auf das sogenannte Self-Tracking, 
bei dem laufend individuelle Körperdaten für die unterschiedlichsten Vitalpa- 
rameter erhoben werden (Aktypi et al., 2017; Neff & Nafus, 2016; Sharon & 
Zandbergen, 2016). Mittlerweile nutzen 14 % der deutschen Bevölkerung soge- 
nannte Digital-Health-Applikationen, also Hard- oder Software, mit deren Hilfe 
sie ihre Kalorienaufnahme, Sportaktivitäten und ihren Schlaf in digitalen Daten 
dokumentieren (Statista, 2018a). Die Liste an Beispielen zu der Vielseitigkeit 
von Datenerhebung und der Vielfalt der entstehenden digitalen Datenbestände 
ist lang und wächst täglich. Sie kann daher an dieser Stelle nur angedeutet wer- 
den, zumal sie ebenfalls lediglich eine deskriptive Dimension des Phänomens Big 
Data betrifft und erst dann tatsächlich relevant wird, wenn der Digitalisierungs- 
kontext eine nähere Betrachtung der spezifischen Charakteristika der Datenvielfalt 
notwendig macht 


8 Auch hier sei bei weitergehendem Interesse auf die folgenden Uberblickswerke zu Big 
Data von Mayer-Schönberger und Cukier (2013), O’Neil (2017), Rudder (2014), Stephens- 
Davidowitz (2017) und Knorre et al. (2020) verwiesen. 
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Es ist an dieser Stelle jedoch auch darauf hinzuweisen, dass die Viel- 
falt der Daten und die Ubiquität der Datensammlung dazu führen, dass je 
nach Schätzung rund 85 bis 95 % der Datensätze aus unstrukturierten Daten 
bestehen (Gandomi & Haider, 2015; Taylor, 2017). Strukturierte Daten sind 
meist in sogenannten relationalen Datenbank-Managementsystemen (RDBMS) 
aufbereitet und folgen in ihrem Aufbau vorher definierten Dateneingaben für 
bestimmte Kennwerte wie Geburtsdaten, Sozialversicherungsnummern und Geld- 
werten (Meier, 2010). Unstrukturierte Daten hingegen bestehen u. a. aus Text, 
Bildern, Audio- und Video-Dateien (Isson, 2018), reichen also von E-Mails hin 
zu Online-Nachrichtenartikeln, von Smartphone-Fotos hin zu Sport-Live-Streams 
und Videos von Überwachungskameras. Das führt nicht nur zu Herausforderun- 
gen mit Blick auf die Auswertungsmöglichkeiten, sondern häufig auch dazu, dass 
man zwar viele und immer neue Daten hat, abhängig vom Verwertungskontext oft 
jedoch erst einmal reflektieren muss, worüber diese Daten denn nun genau Aus- 
kunft geben können. Es muss daher auch die soziale Bedeutung von Big Data in 
ihrem soziotechnischen Kontext angesprochen werden, wobei sogleich auf zwei 
entsprechende Dimensionen einzugehen ist, die das Verständnis vom Sinn und 
Zweck der Sammlung von Big Data anleiten. 


3.5 Die sozio-technischen Dimensionen von Big Data 


Mauro et al. (2016) haben mit Blick auf die allgemeine Literatur zu Big Data den 
Versuch einer Synthese von Definitionen unternommen. Die Autoren legen ihrer 
Betrachtung einen ganzen Korpus an Literatur aus Industrie und Wissenschaft 
zu Grunde. Die finale Definition von Big Data von Mauro et al. (2016) liest sich 
mithin ähnlich der bereits besprochenen Beschreibungsdimensionen: “Big Data is 
the Information asset characterised by such a High Volume, Velocity and Variety 
to require specific Technology and Analytical Methods for its transformation into 
Value [sic]” (S. 131). 

Die vorliegende Arbeit fragt insbesondere nach dem Einfluss der digita- 
len Datenbestände auf soziales Handeln und Gesellschaft. Charakterisierungen 
der digitalen Datenbestände für eine weiter gefasste Betrachtung der sozio- 
technischen Voraussetzungen und Konsequenzen des Umgangs mit Daten werden 
also dann besonders relevant, wenn es nicht mehr um die Fragen nach dem 
Was und Womit geht, sondern vor allem, wenn in sozialen Zusammenhängen 
das Wie und auch Warum der Datenerzeugung, -speicherung und -auswertung 
in den Vordergrund gestellt wird. Hierauf deutet die Bezugnahme von Mauro 
et al. (2016) auf Begriffe wie Asset und Value bereits hin. Es erfolgt hinsichtlich 
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des Verarbeitungszusammenhangs der digitalen Datenbestände hier entsprechend 
eine Erweiterung der Betrachtung auf den Menschen in seiner Rolle als Daten- 
erzeuger, -betrachter und -verwerter, so dass die sozialen Bedingungen und/oder 
Konsequenzen digitaler Datensammlung und -verwertung in den Fokus geraten. 
So stellt bspw. das einflussreiche, jedoch eher populärwissenschaftlich gehal- 
tene Werk von Mayer-Schönberger und Cukier (2013) insbesondere auf diesen 
Zusammenhang ab: “Big data refers to things one can do at a large scale that 
cannot be done at a smaller one, fo extract new insights or create new forms of 
value, in ways that change markets, organizations, the relationship between citi- 
zens and governments, and more” (S. 6, Hervorh. d. Verf.). Jegliche Beiträge, 
die den Schwerpunkt aus einer sozio-technischen Anwendersicht auf Big Data 
legen, gehen also meist davon aus, dass die Daten im Rahmen von Big Data über 
die zuvor beschriebenen Eigenschaften verfügen. Sie halten sich mithin selten 
mit definitorischen Grenzziehungen auf oder streifen diese nur kurz, um dann 
zu thematisieren, wie der menschliche Umgang mit den Daten charakterisiert 
werden kann; insbesondere welche epistemische Qualität und welchen Nutzen 
die Daten für ihn haben und welche Konsequenzen hieraus für Individuum und 
Gesellschaft erwachsen (Doll, 2014). Diese sozio-technischen Fragen lassen sich 
daher in den als konsequentiell-evaluativen Dimensionen Veracity und Value von 
Big Data verorten, die laut Ylijoki und Porras (2016) in 23 % bzw. 27 % aller 
von ihnen untersuchten Definitionen adressiert werden und nachfolgend bespro- 
chen werden. Dabei muss insbesondere auch die Charakterisierung der beiden 
Dimensionen als konsequentiell-evaluativ herausgearbeitet werden. Diese bezieht 
sich auf die Variabilität der Einschätzung der Ausprägung der zugrunde liegen- 
den Dimensionen. Das bedeutet, dass es Big Data gibt, die diese Charakteristika 
und erwarteten Potentiale besitzen, dies jedoch nicht zwingend für alle großen 
digitalen Datenbestände der Fall sein muss. 


3.5.1 Die Richtigkeit digitaler Daten 


Die Richtigkeit (Veracity) digitaler Daten betrifft die epistemische Qualität der 
Daten, bezieht sich also auf Erkenntnis und Wissen. Man kann Veracity auch 
mit Wahrhaftigkeit übersetzen, da jedoch nachfolgend gesondert auf die spe- 
ziellen Wesensmerkmale Wahrhaftigkeit und Objektivität eingegangen wird, ist 
hier zunächst der Oberbegriff der Richtigkeit vorzuziehen. Dieser zielt nicht auf 
eine moralische Qualität ab, sondern auf den qualitativen Wirklichkeitsbezug der 
Daten. Die Richtigkeit betrifft mithin sowohl (1) die Informationsqualität reali- 
tätstreuer Abbildung der Daten sowie (2) das Wissen, das in den Daten steckt 
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bzw. aus ihnen gezogen wird (Cai & Zhu, 2015). Bevor also gesichertes Wissen 
auf Grundlage von Big Data entsteht, müssen weitere Voraussetzungen und not- 
wendige Bedingungen bezüglich der Datenqualität erfüllt sein, die nachfolgend 
diskutiert werden. Für boyd und Crawford (2012) ist es nämlich insbesondere die 
zugesprochene Richtigkeit der digitalen Daten, die einen Mythos von Big Data 
nährt: “The widespread belief that large data sets offer a higher form of intelli- 
gence and knowledge that can generate insights that were previously impossible, 
with the aura of truth, objectivity, and accuracy” (S. 663). Hier werden bereits 
die zentralen Aspekte genannt, die zur Richtigkeit der Daten zählen und nachfol- 
gend erörtert werden. Hierzu gehören die Genauigkeit sowie die Wahrhaftigkeit 
und Objektivität der digitalen Daten, die einen vermeintlichen Wissensgewinn erst 
möglich machen. 


Die Genauigkeit digitaler Daten (Accuracy) 

Die Genauigkeit von digitalen Daten wird oft als eines ihrer zentralen Charakte- 
ristika hervorgehoben. Genauigkeit meint die Wiedergabequalität der Beschrei- 
bung von Zuständen durch Daten oder wie Cai und Zhu (2015) definieren: 
“Data representation (or value) well reflects the true state of the source infor- 
mation” (S. 5). Auch wenn in dieser Definition von Genauigkeit bereits der 
Wahrheitsbegriff enthalten ist und somit anscheinend vorweggenommen wird, 
ist er hier lediglich als Bedingung im Sinne einer Reliabilität der Daten zu 
verstehen. Wie mit Blick auf die nachfolgend besprochene Dimension der Wahr- 
haftigkeit und Objektivität zu diskutieren ist, können jedoch auch subjektive und 
unwahre Zustandsbeschreibungen reliabel in ein konsistentes Datenformat über- 
führt werden. Deshalb ist zu ergänzen, dass die codierte Information dahingehend 
ambiguitätsfrei sein muss, als dass der Übersetzungsvorgang in das digitale For- 
mat störungsfrei vonstattengeht und zu vollständigen mangelfreien Daten führt. 
Eine einmal programmierte Maschine führt Befehle prinzipiell immer auf die 
gleiche Art und Weise aus und produziert somit zumindest in der Theorie Ergeb- 
nisse gleichbleibender Qualität. Dennoch können Datensätze trotz weitreichender 
Automatisierung ihrer Generierung zufällige sowie systematische Integritätsver- 
letzungen beinhalten, unvollständig sein sowie Daten ganz unterschiedlicher 
Codierungsqualität und Güte beinhalten. Die Gründe für diese Fehlerhaftigkeit 
und hieraus resultierende Dirty Data (O’Leary, 2013) sind dabei mannigfaltig 
und können nicht nur technischen Ursprungs sein, sondern haben vor allem auch 
menschliche Ursachen, auf die sogleich eingegangen wird. 
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Die Wahrhaftigkeit und Objektivität digitaler Daten (Truth and Objectivity) 
Aufbauend auf der Genauigkeit der Daten, die insbesondere auf Reliabilität und 
hierauf fußender Belastbarkeit des technischen Übersetzungsvorgangs als Pro- 
zess abstellt, wird der Anspruch formuliert, dass die Daten als Produkt dieses 
Prozesses vor allem auch objektiv und wahrhaftig sind (T. M. Porter, 1996). Ihr 
Anspruch ist es, Merkmale und Eigenschaften von Wirklichkeit transparent zu 
machen (Hansen, 2015). Dabei zielen beide Begriffe auf dasselbe ab und bauen 
untrennbar aufeinander auf: Digitale Daten sollen in ihrer Qualität repräsentativ 
für eine vermeintlich tatsächliche Realität und in ihrem wahrheitsgetreuen Wirk- 
lichkeitsabbild nicht durch äußere Einflüsse verzerrt sein. Es stellt sich mithin 
die Frage nach der Validität der Daten; also ob diese auch tatsächlich dasjenige 
repräsentieren, was sie mit Blick auf ihre Bedeutungszuschreibung repräsentieren 
sollen (Bandalos, 2017; Sireci, 2009). 

Dabei werden entsprechende Verzerrungen auch als Bias bezeichnet und kön- 
nen vielfältiger Natur sein (R. M. Kaplan et al., 2014). Am Ende veranlasst 
und beeinflusst immer menschliche Entscheidung den Übersetzungs- und Pro- 
duktionsprozess von digitalen Daten, weshalb die Daten womöglich nicht das 
wiedergeben, was sie wiedergeben sollen. So können Daten auf der einen Seite 
bereits mit einem Bias produziert werden, bspw. wenn Klassifikationen fehlerhaft 
sind, da Codierentscheidungen subjektiv geprägt sind (Bollen & Paxton, 1998). 
Richardson, Schultz und Crawford (2019) greifen diesbezüglich auch den zuvor 
angesprochenen Begriff Dirty Data auf, wenn sie die in den USA verbreitete Pra- 
xis des Predictive Policing (Vorhersagende Polizeiarbeit, Pollich & Bode, 2017) 
kritisieren. Im Rahmen dieses Beispiels wird die Problematik subjektiv verzerrter 
Daten deutlich, die Ansprüche an Objektivität und Wahrhaftigkeit verletzen: 


These policing practices and policies shape the environment and the methodology by 
which data is created, which raises the risk of creating inaccurate, skewed, or syste- 
mically biased data (‘dirty data’). If predictive policing systems are informed by such 
data, they cannot escape the legacies of the unlawful or biased policing practices that 
they are built on. (Richardson, Schultz & Crawford, 2019, S. 1) 


Auf der anderen Seite können Daten nicht geeignet sein, die spezifischen Fragen 
zu klären, für deren Beantwortung sie herangezogen werden. So sind Bevölke- 
rungsstichproben auf Grundlage sogenannter Sozialer Online-Netzwerke biased, 
da sie nicht repräsentativ für die Gesamtbevölkerung sind (Hargittai, 2015). 
Unabhängig davon, wie der Bias zustande gekommen ist, führen ent- 
sprechende Validitätsverletzungen und Verzerrungen der Daten dazu, dass 
Objektivitäts- und Wahrheitsannahmen häufig nicht haltbar sind. Objektivität und 
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Wahrhaftigkeit sowie auch die Genauigkeit der Daten sind im Rahmen von Big 
Data also zunächst einmal in vielen Definitionen als Ansprüche formuliert, die 
jedoch wie dokumentiert nicht immer eingelöst werden bzw. einfach einzulö- 
sen sind. Es ist eben wie von boyd und Crawford (2012) angesprochen nur der 
Anspruch der genannten epistemischen Bedingungen, die Big Data anhaftet. Es 
zeigt sich allerdings, dass eine qualitative Varianz auf einem Kontinuum zwi- 
schen genau und ungenau, objektiv und nicht objektiv sowie wahr und unwahr 
bestehen kann. Dabei kann die Verletzung der Validität von Daten bzw. das beob- 
achtete Ausmaß der Verzerrung nicht immer zweifelsfrei erkannt und festgestellt 
werden und ist mithin diskussionswürdig (Messick, 1989). Entsprechend kommt 
Messick (1995) auch zu dem Schluss: “Validity judgments are value judgments” 
(S. 748, Hervorh. im Orig.).? Es bleibt an dieser Stelle jedoch zunächst einmal 
festzustellen, dass Validitätseinschätzungen bezüglich Genauigkeit, Objektivität 
und Wahrhaftigkeit digitaler Daten variabel sind. 


Der Wissensgewinn aus digitalen Daten (Knowledge) 

Unter der Voraussetzung, dass die Bedingungen der Genauigkeit sowie Wahr- 
haftigkeit und Objektivität digitaler Daten zu einem hohen Grad gewährleistet 
sind, können digitale Daten als Abbild beobachteter Tatsachen Fakten bereit- 
stellen, die zu neuen Erkenntnissen und einem Wissensgewinn führen (Hansen, 
2015). Nachfolgend beschäftigt sich Abschnitt 4.1 daher ausführlich mit dem 
Wissensbegriff und der Wahrheit als zentralem Kriterium dieses Wissens. An die- 
ser Stelle soll zunächst lediglich die Bedeutung des Wissensbegriffs im Rahmen 
der sozio-technischen Beschreibung von Big Data erörtert werden. 

Wissen auf Grundlage von Big Data ist die elementare Voraussetzung einer 
weitergehenden Verwertung und Nutzung dieser. Dabei soll die Datensammlung 
und -auswertung nicht nur neues Wissen produzieren, sie kann natürlich auch 
bereits bestehendes Wissen in Form digitaler Daten speichern. Die Erwartung 
ist jedoch darauf ausgerichtet, dass durch die binär codierten Sequenzen von 
Zustandsbeschreibungen Unterscheidungen getroffen werden können, aus denen 
Menschen (und eben auch Maschinen) Einsichten generieren und etwas lernen 
können (Leonelli, 2014; Mayer-Schönberger & Cukier, 2013; Pentland, 2014). 
Gewonnene Erkenntnis über Zustände und Mechanismen beeinflusst in der Folge 
Anschlusshandlungen, bspw., wenn Wissen zu treffende Entscheidungen anleitet. 


? Value meint hier nicht Wert im Sinne eines Nutzens, der in Zusammenhang mit digitalen 
Daten nachfolgend besprochen wird, sondern stellt auf subjektive Sichtweisen und Präferen- 
zen sozialer Werte und Normen ab. 
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Es ist zu diskutieren, inwieweit eine Verletzung der Bedingungen der Genauig- 
keit und Objektivität der Daten zwingend dazu führt, dass keine oder geminderte 
Erkenntnis aus digitalen Daten gezogen werden kann. Ausschlaggebend hierfür 
sind dann jedoch primär der jeweilige Grad der Verletzung und der Kontext, in 
dem das Wissen konkrete Konsequenzen zeitigt. Im Vergleich mit den Ergeb- 
nissen eines Temperatursensors, der auf wenige Grad Celsius die ungefähre 
tatsächliche Temperatur wiedergibt, sind die Daten einer stehen gebliebenen Uhr 
nutzlos, selbst wenn sie zweimal am Tag richtig geht. Ist die Genauigkeit des 
Temperatursensors jedoch entscheidend, bspw. bei der Herstellung von tempe- 
ratursensiblen Produkten, dann ist eine hohe Genauigkeit dennoch zentral. Eine 
finale Diskussion dieser Problematik ist also nur mit Blick auf die Erfordernisse 
des Verwertungszusammenhangs digitaler Daten zu entscheiden und kann hier 
nicht abschließend getroffen werden. Wichtig ist jedoch, dass die Genauigkeit 
der Daten prinzipiell technisch möglich ist bzw. sein sollte und mit Blick auf 
die Richtigkeit der digitalen Daten definitorisch vorausgesetzt wird. Wie deut- 
lich geworden ist, hängen die Wahrhaftigkeit sowie die Objektivität jedoch vor 
allem von der zu messenden Entität ab, ihrer konstruierten mentalen Konzeptio- 
nierung auf Seiten der Messenden sowie den getroffenen Operationalisierungs- 
und Messentscheidungen im Rahmen der Überführung realweltlicher Phänomene 
in Daten. 

Gerade mit Blick auf die Ubiquität digitaler Datenerzeugung und die Möglich- 
keiten ihrer Auswertung ist nun also diejenige Erkenntnis von Interesse, die erst 
aus den digitalen Daten gewonnen werden kann. Dabei ist es zunächst unerheb- 
lich, ob die Daten gezielt erzeugt werden oder ganz nebenbei anfallen.!° Während 
die Qualität der Daten und der hieraus gewonnenen Erkenntnisse also durchaus 
auf einem Kontinuum eingeordnet werden können, soll an dieser Stelle zunächst 
die zentrale Bedeutung der Dimension des Wissensgewinns im Rahmen der Defi- 
nition großer digitaler Datenbestände hervorgehoben werden. Eine detaillierte 
Diskussion der Qualität und sozialen Bedeutung dieses Wissens, insbesondere 
auf Grundlage von Big Data, wird nachfolgend in Kapitel 4 geleistet. 

Die Qualität der Daten aus epistemischer Perspektive, sprich ihre Erforderlich- 
keiten und Konsequenzen mit Blick auf mögliche Erkenntnis, hat eine zentrale 
Bedeutung im Entstehungs- und Verwertungskontext von Big Data (Fricke, 
2015; Kitchin, 2014). Während die zuvor thematisierten Wesensmerkmale eine 


10 Wobei selbstredend auch eine beiläufige Datenspeicherung bewusst geschieht und die 
Erzeugung aktiv veranlasst werden muss. Gemeint ist hier vor allem, dass bei der Erzeu- 
gung und Speicherung noch nicht auf eine bestimmte Auswertung, die eine spezielle Frage 
beantworten soll, abgestellt wurde. 
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vermeintliche Grundvoraussetzung für den Wissensgewinn sind, ist der Wissens- 
gewinn wiederum die Vorbedingung für den aus den Daten gezogenen Nutzen 
und somit ein notwendiges Bindeglied zwischen Ausmaß der Datensammlung 
und -verwertung und den hiermit verbundenen positiven Konsequenzen für Indi- 
viduum oder Gesellschaft. Der nun nachfolgend besprochene Nutzen digitaler 
Daten hängt maßgeblich von der Qualität und der Reichweite dieses generierten 
Wissens ab. 


3.5.2 Der Nutzen digitaler Daten 


Die Unmengen von digitalen Daten werden selbstverständlich nicht zum Selbst- 
zweck erzeugt und gespeichert. Zwar fallen wie gezeigt viele Daten ganz 
nebenbei beim Betrieb von Computertechnik und Sensoren an. Die Entschei- 
dung über Speicherung und Verarbeitung wird jedoch bewusst getroffen. Denn 
auch wenn Rechenkapazität und Speicherplatz über die Zeit immer preisgünsti- 
ger werden, verursachen Entstehung, Speicherung und Verarbeitung von Daten 
hohe Kosten mit Blick auf Speichermedien, Prozessoren, Serverinfrastruktur und 
den beim Betrieb anfallenden Stromverbrauch (Greenberg et al., 2008; Le et al., 
2010). Diese Kosten werden nur in Kauf genommen, wenn ihnen gegenüber auch 
ein erwarteter Nutzen (Value) steht. 

Die Dimension des Nutzens ist nun eng mit der Wahrhaftigkeit und dem in 
den Daten enthaltenen Wissen verknüpft und baut unmittelbar auf ihr auf (Lup- 
ton, 2013; Sharon & Zandbergen, 2016). Der aus den Daten gewonnene Nutzen 
stellt auf einen generierten Mehrwert ab, der auf Grundlage der Daten geschaf- 
fen wird (Mahrt & Scharkow, 2013). Diese Nutzenerwartung ist dabei immer 
mit Bezug auf das menschliche Individuum oder die Gesellschaft und somit 
als explizit sozio-technische Dimension zu verstehen. Die Zweckgebundenheit 
von Datensammlung und -verarbeitung ist dabei an vielen Stellen in den vor- 
hergehenden Abschnitten bereits durchgeklungen, soll an dieser Stelle jedoch 
noch einmal differenziert betrachtet werden. Denn Nutzen kann hier durchaus 
in seinem doppeldeutigen Gebrauch verstanden werden. 

Zum einen können Daten verwendet werden: Sie sind dann mit Blick auf ihren 
oft als ‚ОТ des 21. Jahrhunderts‘ beschriebenen Charakter ein nicht-dinglicher 
Energieträger, der ‚genutzt‘ oder ‚einer Nutzung oder Verwertung zugeführt‘ wer- 
den kann; gleich eines Schmierstoffes, der datenverarbeitende Anwendungen am 
Laufen hält. Gleichzeitig entspringt mit Blick auf den Erkenntnisgewinn aus die- 
ser Nutzung ein Nutzen im Sinne von Gewinn oder Profit, so wie auch Öl einen 
Marktpreis hat und als Produktionsmittel für mit Gewinnabsicht produzierte Güter 
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und Dienstleistungen verwendet wird. Dieser Nutzen ist dann vor allem, jedoch 
nicht allein als Nutzen im Rahmen einer ökonomischen Verwertungslogik zu 
sehen (Chen et al., 2012; Mayer-Schönberger & Cukier, 2013). 

Der Zuschnitt nur auf ökonomischen Nutzen ist hier also zu eng gefasst. 
Ein Nutzen kann sich ferner auch in anderen sozialen Kontexten wie Poli- 
tik, Wissenschaft und Zivilgesellschaft manifestieren und ist hier vor allem 
mit Begriffen wie bspw. Open Data verbunden, womit kostenfreie öffentlich 
zugängliche Datensätze, auf die jeder frei zugreifen kann, gemeint sind und 
deren Nutzen vielfältigerer Natur sein kann (Mayernik, 2017; World Wide Web 
Foundation, 2018). Gleichwohl der konkrete Nutzen vor allem im jeweiligen 
Entstehungs- und Verwertungskontext betrachtet werden muss, lässt sich mit 
Blick auf die allgemeine gesellschaftliche Durchdringung von informationstech- 
nischen Anwendungen der Datenverwertung insbesondere mit Blick auf deren 
öffentliche Thematisierung zwischen einem Nutzen unterscheiden, der sich auf 
einer gesellschaftlich höher-gelagerten Ebene realisiert (Weyer et al., 2018), und 
einem Nutzen, der sich für das Individuum ergibt (Knorre et al., 2020). 


Individueller Nutzen digitaler Datensammlung und -verwertung 

Aus der Sicht des Individuums in der digitalen Gesellschaft sind mit Blick auf 
die Bewertung des großen Ausmaßes digitaler Datensammlung und -verwertung 
zunächst insbesondere Konsequenzen für die eigene Person relevant, da Big Data 
auch seine unmittelbare Lebenswelt betrifft (Knorre et al., 2020). Geht es um 
eine generelle Bewertung von Big Data, haben bedingt durch die Zweckgebun- 
denheit digitaler Datensammlung und -verwertung mithin Einschätzungen zum 
persönlichen Nutzen einen zentralen Einfluss: Jedes Individuum trifft hier für sich 
im Rahmen einer laufenden Kosten-Nutzen-Kalkulation eine Abwägung (Diek- 
mann & Voß, 2004a; Kunz, 2004), ob und inwieweit es von Big Data profitiert. 
Das gilt zwar ganz allgemein für die weitreichende Datensammlung, wird jedoch 
vor allem in Situationen relevant, in denen eine Entscheidung getroffen werden 
muss, eigene persönliche Daten preiszugeben. Insbesondere hier stellt sich die 
Frage, warum Daten gesammelt und ausgewertet werden sollten: Was habe ich 
davon, wenn Online-Angebote umfassende Daten erheben und speichern und ich 
im Internet laufend der Aufzeichnung und Auswertung meiner Nutzungsdaten 
zustimmen muss? Warum sollte ich der Uhr an meinem Handgelenk erlauben, 
laufend meinen Puls zu messen? Entscheidend für diesbezüglich getroffene Ent- 
scheidungen ist, dass man sich etwas hiervon verspricht. Etwa, wenn man bei 
Online-Angeboten auf die eigenen Präferenzen abgestimmte Produktangebote und 
Vorschläge für Videos oder Musikstücke erhält, die einem gefallen könnten. Oder 
wenn man aus der Erhebung der eigenen Vitalparameter etwas über den eigenen 
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Gesundheitszustand erfährt und man bspw. sieht, dass das Ausdauertraining auch 
tatsächlich zu einer Leistungssteigerung führt. Dabei knüpft der vermeintliche 
Nutzen auch und insbesondere an die zuvor beschriebene Leistungsfähigkeit der 
Daten hinsichtlich eines Erkenntnisgewinns an (Sharon & Zandbergen, 2016): 


Where the question of the value of data for those who generate it is addressed, this 
value is typically understood as residing in the aura of neutrality and objectivity that 
numbers convey, and their role in a will to (quantified) truth. (S. 1696, Hervorh. im 
Orig.) 


Der Abwägungsprozess bezüglich des Ausmaßes individuellen Nutzens speist 
sich dabei im Rahmen der Kosten-Nutzen-Kalkulation aus diversen Nutzener- 
fahrungen und -erwartungen, die sich aus den unterschiedlich gelagerten Ver- 
wertungskontexten digitaler Daten ergeben können. Dies ist etwa der Fall, wenn 
es Sicherheitsbedenken bei der Preisgabe persönlicher Daten im Rahmen von 
digitaler Mediennutzung gibt, deren Zusammenhang in der Privacy-Forschung 
untersucht wird (Dienlin & Metzger, 2016; Dinev & Hart, 2006). 


Gesellschaftlicher Nutzen aus digitaler Datensammlung und -verwertung 

Jenseits eines individuell realisierten Nutzens durch Big Data werden durchaus 
auch Erwartungen formuliert, die darauf abzielen, wie Big Data für die Gesell- 
schaft von Nutzen sein können und sollen (Houben & Prietl, 2018; Kolany-Raiser 
et al., 2018; Mayer-Schönberger & Cukier, 2013). Big Data müssen hierbei 
fernab jedes Technikoptimismus oder -pessimismus zunächst einmal als ein Werk- 
zeug betrachtet werden, das sowohl Schäden verursachen oder Nutzen bringen 
kann. So können Schäden, die aus einer weitreichenden Datensammlung von 
Gesundheitsdaten entstehen, etwa wenn diese Daten in falsche Hände geraten, 
den individuellen und vor allem auch gesellschaftlichen Vorteilen gegenüberge- 
stellt werden. Es ist positiv zu bewerten, sollten aus der zentralen Speicherung 
und Auswertung von Daten zu Krankheiten und deren Behandlung neue Thera- 
piemöglichkeiten entstehen, von denen ich und viele andere profitieren, weil sich 
Gesundheit verbessert und sich Kosten vermeiden lassen. 

Natürlich muss ein Nutzen, der nicht vom Individuum realisiert wird, nicht 
auch automatisch auf gesamtgesellschaftlicher Ebene eintreten. Zwischen der 
Mikro- und der Makro-Ebene gibt es unzählige weitere mögliche Profiteure mit 
individuellen Sonderinteressen, die sich auf der Meso-Ebene ansiedeln lassen. 
Die Nutzenerwartung an die großen digitalen Datenbestände kann hier wie folgt 
beschrieben werden: 
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Right now big data is enabling organizations to move away from intuitive- to data- 
based decision making. Ultimately, enterprises will use big data because it creates 
value by solving new problems, as well as solving existing problems faster or chea- 
per, or providing a better and richer understanding of those problems. (O’Leary, 2013, 
5. 99) 


Zu den angesprochenen Organisationen gehören bspw. Hacker sowie Datenakti- 
vist*innen (Cardullo, 2015; Schrock, 2016) oder gleich ganze gesellschaftliche 
Felder wie die Forschung (Aitken et al., 2018; Mahrt & Scharkow, 2013), der 
Journalismus (C. W. Anderson, 2013; Coddington, 2015; Lewis, 2015), die Wirt- 
schaft sowie staatliche Institutionen (Andrejevic & Gates, 2014; Lyon, 2014). 
Doch selbst wenn diese einzelnen Gruppen und Einheiten partikulare Interessen 
verfolgen, so sind sie gesellschaftlichen (Teil-)Systemen zuzuordnen, die inner- 
halb der Gesellschaft wichtige Funktionen übernehmen und gesellschaftlichen 
Wandel bewirken und hier etwaigen Nutzen für die Gesellschaft erbringen oder 
auch nicht.!! 

Für eine übergeordnete gesellschaftliche Wahrnehmung von digitalen Daten 
kann an dieser Stelle daher mit Blick auf Nutzenerwartungen nicht kleinteilig 
unterschieden werden. Es mag je nach individueller Bewertung und eigenem 
Vorwissen und Erfahrung auf unzählige einzelne Bereiche abgestellt werden, 
in denen Nutzen durch Big Data gesehen wird oder eben auch nicht. Darüber 
hinaus sollte es jedoch zu einer allgemeinen Gesamtbewertung beim beobachten- 
den Individuum kommen, die auf einer Einschätzung zum Nutzen von Big Data 
für die Gesamtgesellschaft beruht, deren Teil man ist. In Abhängigkeit von vie- 
len individuell zu treffenden Einschätzungen wird der generelle Nutzen von Big 
Data sowohl für das Selbst als auch für die Gesellschaft bewertet. Unbenommen 
möglicher noch feinteilig differenzierter Zwischenstufen der Nutzeneinschätzung, 
die jedoch theoretisch und empirisch erst einmal zu beschreiben wären. Es ist 
zunächst zu prüfen, inwieweit sich individuelle und gesellschaftliche Nutzenüber- 
zeugungen analysieren lassen. Dies lässt dann immerhin auch die Möglichkeit zu, 
zu untersuchen, ob beide Einschätzungen zusammen- oder auseinanderfallen, was 
mit Blick auf die Abwägung von Schadens- und Nutzenbewertung eine relevante 
Frage ist. 


И So fragt auch die Europäische Kommission (2017b) bei ihren Bürger*innen explizit nach 
den wahrgenommenen Auswirkungen der Digitalisierung auf das Selbst, die Gesellschaft 
sowie die Wirtschaft. 
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3.6 Die Bedeutung von Big Data im Zusammenhang mit 
Algorithmen, Künstlicher Intelligenz und 
maschinellem Lernen 


An dieser Stelle muss nun zudem kurz auf technische Anwendungskontexte im 
Zusammenhang mit den großen digitalen Datenmengen abgestellt werden, um 
deutlich zu machen, wie Big Data sich zu unmittelbar angrenzenden Techni- 
ken wie Algorithmen oder Anwendungen Künstlicher Intelligenz (КЇ) verhalten, 
die Datenverarbeitung und -auswertung in den vorliegenden Ausmaßen erst 
ermöglichen. 

Algorithmen sind hier das Bindeglied zwischen der Hardware und den digi- 
talen Daten, denn „elektronische Datenverarbeitung beruht auf Algorithmen“ 
(Cormen et al., 2017, S. XIID. Ein Algorithmus definiert sich nach Kraemer 
et al. (2011) wie folgt: “An algorithm is, roughly speaking, a finite sequence of 
well-defined instructions that describe in sufficiently great detail how to solve 
a problem” (S. 251). Die Computerhardware wird nicht zuletzt auch Rechner 
genannt, aufgrund der programmiersprachlichen Formulierung von Algorithmen 
als Entscheidungsregeln, die häufig in Gestalt von mathematischen Formeln fest- 
gelegt sind. Die digitalen Daten werden den Algorithmen als Eingabe zugeführt 
oder entstehen als Ausgabe algorithmischer Verarbeitung (Cormen et al., 2017). 
Dabei ist das besondere an den Algorithmen, dass sie wie die IuK fortlaufend 
eingesetzt werden können. Als einprogrammiertes System von Rechenvorschrif- 
ten können Rechenprobleme nun mit Hilfe von IuK automatisiert gelöst werden. 
Dabei stehen die Algorithmen nicht nur in einem Verwertungszusammenhang 
mit digitalen Daten, auch mit ihnen verbundene Problematiken erinnern an die 
zuvor aufgeworfenen Schwierigkeiten menschlicher Fehlbarkeit und subjektiver 
Einflüsse im Rahmen ihres Einsatzes: 


Zwar genießen Algorithmen oftmals den Nimbus der Objektivität, weil sie unper- 
sönlich sind und quantitative Daten verarbeiten, doch diese kalkulativen Praktiken 
selbst sind keineswegs neutrale Verdatungsformen des Sozialen. Algorithmen ste- 
hen in einem unauflöslichen Zusammenhang mit sozialen Formen der Zuschreibung 
von Wertigkeit, und in diesem Sinne produzieren und repräsentieren sie das, was für 
relevant oder wertvoll gehalten werden soll. (Mau, 2017, S. 204-205) 


Algorithmen werden folglich dort für das Wahrnehmungsmuster digitaler Daten 
relevant, wo sie die in den Daten verbundenen Problemlagen noch verschär- 
fen oder gar dazu eingesetzt werden sollen, einmal identifizierte Probleme 
abzumildern oder gar zu beseitigen. Wenn in den Daten Verzerrungen oder Unge- 
nauigkeiten vorliegen, ihr Wirklichkeitsabbild fraglich ist oder aber, wenn eine 
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andere Gewichtung der Daten gewünscht ist, dann sollen die Rechenvorschriften 
der Algorithmen zur Datenverarbeitung eben angepasst werden. Ihr Verhältnis 
zu den digitalen Datenbeständen ist somit an dieser Stelle verdeutlicht. Es wird 
jedoch im vorliegenden Forschungszusammenhang zwecks begrifflicher Klarheit 
und der vorrangigen Fokussierung auf ganz allgemeine Datensammlung und - 
verwertung nicht weiter ausgeführt und explizit unter dem Label Algorithmus 
angesprochen. Weiterhin sind Algorithmen jedoch auch unverzichtbarer Teil des 
Entstehungs- und Verwertungszusammenhangs digitaler Daten, wenn es um den 
Fall von Anwendungen der KI geht, bei denen die Folgen von Rechenvorschrif- 
ten eine elementare Rolle spielen. Auch hier soll nicht mit dem eher allgemeinen 
Begriff Algorithmus operiert werden, sondern auf die wesentlichen Charakte- 
ristika der KI abgestellt werden, die nachfolgend erläutert und zu Big Data in 
Beziehung gesetzt werden. 


Künstliche Intelligenz und maschinelles Lernen 

Im Rahmen der Diskussion um die Digitalisierung der Gesellschaft erfährt der- 
zeit auch der Begriff der KI wieder eine Renaissance (Bostrom, 2016; Cath et al., 
2018; Wittpahl, 2019). Ein Phänomen, das nach heutigem Stand in seinen zentra- 
len Anwendungen wie Machine Learning (ML) vor allem auf die Verfügbarkeit 
der großen digitalen Datenbestände angewiesen und daher unmittelbar mit Big 
Data verbunden ist (Mayer-Schönberger & Cukier, 2013). Beginnend mit der 
Darthmouth Conference im Jahr 1956 wurde an der Entwicklung von Computer- 
systemen gearbeitet, die intelligente Eigenschaften besitzen (Rid, 2017). Obwohl 
es keine allgemeingültige Begriffsbestimmung, sondern viele unterschiedliche 
Definitionen von ‚natürlicher‘ Intelligenz gibt, wie sie bei Mensch und Tier zu 
beobachten ist (Legg & Hutter, 2007), entstehen derzeit weltweit Forschungs- 
programme, die besagte KI entwickeln und ihren gesellschaftlichen Einsatz 
vorantreiben. So stellte auch die Bundesregierung Deutschlands im Sommer 2018 
Eckpunkte für eine zu entwickelnde nationale KI-Strategie vor (Bundesregierung 
Deutschland, 2018b), die im November 2018 verabschiedet und der Öffentlichkeit 
präsentiert wurde (Bundesregierung Deutschland, 2018a). 

Ganz allgemein stellt KI darauf ab, dass Maschinen intelligente Fähigkei- 
ten demonstrieren, die man sonst nur im Rahmen natürlicher Intelligenz bei 
Menschen beobachtet und die sich u. a. in mathematischem, sprachlichem oder 
räumlichem Denken, Merkfähigkeit, Wahrnehmung, Auffassungsgabe und Verar- 
beitungsgeschwindigkeit äußern (Bostrom, 2016; Finlay, 2017; J. Kaplan, 2016). 
Dabei ist der Begriff KI dahingehend zunächst einmal irreführend, da er falsche 
Vorstellungen davon vermittelt, welche konkreten Anwendungen sich unter dem 
allgemein gehaltenen Label derzeit versammeln. Häufig geht es bei KI um 
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Computerprogramme des maschinellen Lernens, die mit Hilfe von Algorithmen 
Muster in den großen digitalen Datenbeständen erkennen sowie Objekte und 
Personen identifizieren und zuordnen (Alpaydin, 2016). 

Nicht nur, dass viele KI-Systeme und insbesondere ML-Anwendungen auf 
Big Data angewiesen sind, um zu lernen, die Mustererkennung und Vorhersagen 
zu verbessern. KI kann potentiell auch dafür eingesetzt werden, die anfallenden 
Datenbestände zu be- und verarbeiten. So führt O’Leary (2013) aus, dass KI 
mit Blick auf die Entstehungsgeschwindigkeit der digitalen Daten schnellere und 
umfassendere Entscheidungen treffen kann als der Mensch, und führt als Bei- 
spiel den Einsatz von High-Frequency-Tradingsystemen an der Börse an. Hier 
werden unzählige laufend eingehende Informationen in Sekundenbruchteilen von 
Computerprogrammen gesichtet und bewertet, um Kauf- oder Verkaufsentschei- 
dungen zu treffen. Laut Glantz und Kissell (2014, S. 258) entfällt mittlerweile 
der Großteil der börslichen Handelsaktivität (85 % im Jahr 2012) auf die unter 
dem Stichwort Algorithmic Trading zusammengefassten Computersysteme, von 
denen etliche KI-basiert sind (Martinsky, 2010; Slade, 2018). !2 

Insbesondere aufgrund der angeführten Unstrukturiertheit vieler großer Daten- 
bestände verbinden sich mit KI Hoffnungen auf einen vereinfachten Umgang mit 
den angesprochenen Herausforderungen bei der Verarbeitung und Auswertung 
von Big Data. Da maschinelles Lernen in der Lage ist, große Datenmengen 
verhältnismäßig schnell und zuverlässig zu verarbeiten und hierin Muster zu 
erkennen, erlauben diese Programme einen vermeintlich einfacheren Zugang zu 
großen unstrukturierten Datensätzen (O’Leary, 2013). 

Die Mustererkennung ist hier vor allem im Zusammenhang mit dem nach- 
folgend zu besprechenden Wissen zu bewerten. Erst durch Big-Data-Analytics 
ergibt sich ein Erkenntnisgewinn aus den zunächst einmal unzugänglichen und 
somit wertlosen Daten (Barlow, 2013). Denn ohne diese maschinelle Hilfe könnte 
kein Mensch die großen digitalen Datenbestände bearbeiten und ein Verständnis 
hieraus gewinnen, weshalb sich insbesondere Fragen nach dem vermeintlichen 
Erkenntnisgewinn und einem hieraus gezogenen Nutzen der Analyse von Big 
Data durch КЇ ergeben. 

Aus den beispielhaften Ausführungen wird deutlich, dass öffentliche Erwar- 
tungen bestehen, in deren Rahmen sich Big Data und Musterkennung gegenseitig 
befruchten und gemeinsam gewinnbringend genutzt werden können. So ist es für 


12 Auch sei hier analog zu den Fallstricken mit Blick auf die Richtigkeitsdimension der Big 
Data auf die Fehleranfälligkeit dieser vermeintlich intelligenten Systeme verwiesen. So kam 
es am 6. Mai 2010 zu einem sogenannten Flash Crash, bei denen Aufträge der Programme 
kurzzeitige Börsenturbulenzen ausgelöst haben (Kirilenko et al., 2017). 
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Katz (2017) nicht überraschend, dass das erneute Aufblühen der an KI gerich- 
teten Erwartungen eng mit dem Aufkommen von Big Data im Rahmen einer 
ökonomischen Verwertungslogik verbunden ist und von den Unternehmen aktiv 
befördert wird: 


Corporations have helped manufacture an ‘AI revolution’ in which AI stands for a 
confused mix of terms—such as ‘big data,’ ‘machine learning, or ‘deep learning’— 
whose common denominator is the use of expensive computing power to analyze 
massive centralized data. (S. 2) 


Eine Befragung von Kersting und Meyer (2018) unter KI-Forschern aus Wis- 
senschaft und Industrie kommt zwar zu dem Ergebnis, dass KI und Big Data 
miteinander in Bezug stehen, dass sie jedoch zumindest von Expertenseite auf 
keinen Falls als deckungsgleich oder miteinander konvergierend erachtet wer- 
den. Ihre Verbindung wird jedoch auch hier dadurch deutlich, dass die KI und 
hier genauer die angesprochenen ML-Anwendungen als eine Zugangsmöglich- 
keit zu den Daten, vor dem Hintergrund der technischen Herausforderungen ihres 
Entstehungs-, insbesondere jedoch ihres Verwertungskontextes, gesehen werden. 
KI ist weithin auch als eine „Methode der Erkenntnisgewinnung“ (Mohabbat 
Kar & Parycek, 2018, S. 9) zu betrachten, die auf digitale Daten zurückgreift, 
Muster in ihnen erkennt und so das aus ihnen destillierbare Wissen zugänglich 
macht. Folglich werden unlängst immer mehr Innovationen aus dem Feld der KI 
für die Verwendung in den unterschiedlichsten Gesellschaftsbereichen angedacht 
oder bereits eingeführt. Daher stellt auch der letztendliche Forschungszusammen- 
hang zu einem Glauben an Big Data nachfolgend vor allem auf den Einsatz 
von datenverarbeitenden KI-Anwendungen ab (siehe Kapitel 7). Insbesondere mit 
Blick auf die zuvor angesprochenen Verheißungen von Erkenntnis- und Nutzen- 
gewinnen erfährt Big Data in Verbindung mit KI-Anwendungen derzeit also eine 
hohe gesellschaftliche Aufmerksamkeit. Wichtig ist hier also der Bezug zwischen 
digitalen Daten und Wissen sowie dessen Bedeutung im Zusammenhang mit der 
gesellschaftlichen Ordnung und Verwertung von Wissen, der nun nachfolgend 
genauer herausgearbeitet wird. 
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Wie erörtert, sollen Daten die Wirklichkeit nicht nur vermeintlich objektiv, 
realitätsgetreu und folglich wahrheitsgemäß abbilden, sondern auf den Daten 
basierende Einsichten sollen und werden im Rahmen einer vorrangig ökono- 
mischen Verwertungslogik in der postindustriellen Gesellschaft genutzt.' Die 
besondere Bedeutung der Erzeugung, Verteilung und Verwertung von Wissen auf 
Datengrundlage spielt dabei auch direkt auf Vorstellungen an, die mit dem Kon- 
zept der Wissensgesellschaft verbunden sind und in den vergangenen Jahrzehnten 
vielfach in der Öffentlichkeit diskutiert wurden (Kübler, 2009). 

Im Zuge des technischen Fortschritts entstand ein neues Verständnis der 
Wesensmerkmale von Gesellschaften unter dem Einfluss neuer IuK, das auf deren 
spezifische Auswirkungen auf Wissensordnungen und deren gesellschaftliche 
Bedeutung abstellt. Innovationen wie das Internet und Smartphone diffundieren 
dabei nach und nach über den ganzen Erdball, so dass digitale Technologien 
mittlerweile auch in den Schwellen- und Entwicklungsländern weite Verbreitung 
finden (Etzo & Collender, 2010; UNCTAD, 2017). Stand 2018 gibt es allein 
in Afrika mehr als 419 Millionen Nutzer*innen mobiler Breitbandverbindungen 
(Reed, 2017). Das einst von McLuhan (1962) vorgestellte globale Dorf nimmt 
damit in den Augen vieler Beobachter*innen nach und nach Gestalt an und lässt 
die Welt durch schnellen entgrenzten Wissensaustausch vor allem wirtschaftlich 
zusammenwachsen (Friedman, 2005). 

Die gestiegene quantitative und qualitative Bedeutung von Informationen und 
Wissen wurde in diesem Zusammenhang auch von der Wissenschaft kommen- 
tiert und als Anlass genommen, Gesellschaftsentwürfe und Epochen wie das 
Informationszeitalter (Castells, 1996, 1997, 1998) oder die Wissensgesellschaft 
auszurufen (Böhme & Stehr, 1986; Kübler, 2009; Stehr, 2012). Bevor jedoch 


! Zum Begriff der post-industriellen Gesellschaft siehe D. Bell (1973) und Drucker (1993). 
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auf entsprechende globale Gesellschaftsdiagnosen eingegangen werden kann, soll 
nachfolgend zunächst dargelegt werden, was es mit dem Begriff des Wissens auf 
sich hat (siehe Abschnitt 4.1). Dabei soll Wissen immer in seiner besonderen 
Beziehung zu den Eigenschaften der großen digitalen Datenbestände betrachtet 
werden. Anschließend muss dann erörtert werden, wieso nun Wissen eine zentrale 
Kategorie der Gesellschaftsdiagnose der Wissensgesellschaft ist, warum diese im 
Zusammenhang mit den digitalen Daten eine positive Konnotation erfährt und 
welche kommunikative Bedeutung ein entsprechender Mythos in diesem Zusam- 
menhang hat (siehe Abschnitt 4.2). Erst vor diesem Hintergrund kann die soziale 
Bedeutung des Wissens aus Quantifizierung und hierauf basierender Vergleiche 
in einer digitalisierten Welt demonstriert werden (siehe Kapitel 5). Auch kann 
erst dann die Konsequenz für die Erwartungen an digitale Daten herausgearbeitet 
werden, um eine Analyse der Konsequenzen gesellschaftlicher Perzeptionen von 
datenverarbeitender IuK vorzubereiten (siehe Kapitel 6). 


4.1 Der Wissensbegriff 


Wissen ist ein zentraler Begriff für die vorliegende Arbeit. Es wäre zu kurz 
gegriffen, sich damit zu begnügen, auf den vordergründig allgemein- und somit 
vermeintlich selbstverständlichen Zusammenhang von Wissen abzustellen und 
über diese Verkürzung direkt mit der Bedeutung des Wissensbegriffes im Rahmen 
der Wissensgesellschaft sowie der eigentlichen Unterscheidung von Wissens- und 
Glaubenssystemen fortzufahren. Es müssen zunächst die Bedingungen des Wis- 
sens erörtert werden, um nachfolgend zu zeigen, wie sich Wissen zu den digitalen 
Datenbeständen und auch den Bürger*innen verhält. Welches Wissen steckt in 
den Daten bzw. kann in ihnen stecken? Welchen Zugang haben Bürger*innen zu 
diesem Wissen? Dabei wird deutlich werden, dass Wissen unterschiedliche Qua- 
litäten und somit Affordanzen besitzt. Es ist dann herauszuarbeiten, über welches 
Wissen denn konkret gesprochen wird, wenn über aus digitalen Daten gewonne- 
nes Wissen gesprochen wird, und wie die oder der durchschnittliche Bürger*in 
auf dieses Wissen zugreift, es internalisieren und nutzen kann oder zumindest an 
einem solchen Prozess teilhaben kann, wenn Dritte das Wissen aus den Daten 
verarbeiten. 

Wo fängt eine Beschäftigung mit Wissen an? Die Literatur zum Begriff des 
Wissens (und auch des Glaubens sowie ihrer Abgrenzung) ist nicht zu über- 
schauen. Abhandlungen darüber, ob und wie der Mensch wissen und erkennen 
kann, füllen Bibliotheken und führen ideengeschichtlich zurück bis in die Antike 
zu Platon (2017). Die Erkenntnistheorie, auch Epistemologie genannt, ist ein 
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Hauptgebiet der Philosophie und eine eigene Wissenschaftsdisziplin (Baumann, 
2015). Da Wissen das Wesen von Wissenschaft im Kern betrifft und diese Arbeit 
insbesondere auf die Wissensdimension von Big Data abstellt und einer sozi- 
alwissenschaftlichen Analyse zuführt, kann und soll zwar keine ausführliche 
philosophische Aufarbeitung geleistet werden. Jedoch sind an dieser Stelle ein 
paar Setzungen sinnvoll und nötig, die deutlich machen, wie sich Wissen zur 
besonderen Qualität digitaler Daten verhält. Sie beschränken sich dabei auf ein 
Grundverständnis und stehen nachfolgend immer in konkretem Bezug zu Big 
Data und dem Erkenntnisinteresse der vorliegenden Arbeit.” 

Wenden wir uns zunächst einer Definition von Wissen zu und erörtern, was 
gemeinhin gemeint ist, wenn von Wissen gesprochen wird. Ähnlich wie bei den 
zuvor thematisierten theoriegeladenen Konstrukten Digitalisierung oder Big Data 
gibt es auch für Wissen keine allgemeingültige Definition. Mal wird Wissen 
als eine Handlungskompetenz (von Subjekten) verstanden, mal als „auf wahre 
Aussagen zielende Größe“ (J. Hofmann, 2001, S. 3). Laut Ichikawa und Steup 
(2018) gibt es trotz weitreichender Begriffsarbeit und epistemologischer Kon- 
zeptionierungsansätze keine allgemein akzeptierte systematische Untersuchung 
des Wissens und seiner Bestandteile, wobei teilweise bereits die Möglichkeit 
solch einer Analyse verneint wird. Bei ihrer Betrachtung von Wissen stellen sie 
insbesondere auf propositionales Wissen und dessen Bedingungen ab: 


The project of analysing knowledge is to state conditions that are individually 
necessary and jointly sufficient for propositional knowledge, thoroughly answering 
the question, what does it take to know something? By ‘propositional knowledge’, 
we mean knowledge of a proposition—for example, if Susan knows that Alyssa is a 
musician, she has knowledge of the proposition that Alyssa is a musician. ($ 2) 


Dieses Verständnis propositionalen Wissens, bei dem gefragt wird, welche 
Bedingungen erfüllt sein müssen, damit man wissen kann, ist aufgrund seiner sub- 
jektbezogenen Perspektive auch für die vorliegende Arbeit zielführend. Wissen 
wird dabei in der klassischen Analyse von Wissen (KAW) auch als ein ‘justified 
true belief’ verstanden, den eine Person haben kann (Ichikawa & Steup, 2018). 
Wie nun zu erörtern sein wird, ist das im vorliegenden Forschungszusammenhang 
thematisierte Wissen auf Grundlage digitaler Daten an dieses Wissensverständnis 
anschlussfähig. 


? Darüber hinaus interessierten Leser*innen seien hier die Einführungen zur Erkenntnistheo- 
rie von Baumann (2015) und die Einführung in die Wissenssoziologie von Knoblauch (2014) 
empfohlen. 
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Den Ausführungen von Ichikawa und Steup zu dieser traditionellen Drei- 
teilung folgend, muss Wissen mithin drei notwendige und zusammenwirkend 
hinreichende Bedingungen erfüllen, die nachfolgend erläutert werden: (1) die 
Bedingungen der Wahrheit, (2) der Überzeugung und (3) der Rechtfertigung (auch: 
Nicht-Zufälligkeit, vgl. Baumann, 2015, S. 37—40). 


4.1.1 Die Bedingung der Wahrheit 


Ichikawa und Steup (2018, $ 10) folgend kann man nur Dinge (nachfolgend 
auch als Entitäten bezeichnet)? wissen, die wahr sind. Aussagen, die falsch oder 
unwahr sind, können somit nicht gewusst werden. Dabei ist für die Wahrheit 
einer Entität jedoch nicht notwendig, dass überhaupt jemand etwas über sie wis- 
sen kann oder in der Lage ist, zu beweisen, dass sie wahr ist. Eine Wahrheit 
muss mithin nicht bekannt sein, aber Wissen, das bekannt ist — im Sinne einer 
getroffenen Feststellung von etwas vermeintlich Gewusstem — muss wahr sein. 


Truth is a metaphysical, as opposed to epistemological, notion: truth is a matter of how 
things are, not how they can be shown to be. So when we say that only true things can 
be known, we’re not (yet) saying anything about how anyone can access the truth. (...) 
Knowledge is a kind of relationship with the truth—to know something is to have a 
certain kind of access to a fact. (Ichikawa & Steup, 2018, $ 12, Hervorh. im Orig.) 


Die Bedeutung dieser Bedingung wird also insbesondere in solchen Momenten 
deutlich, in denen die Voraussetzung der Wahrheit verletzt ist, also bspw. mit 
Bezug auf unwahre Tatsachen, wie etwa der um Mitternacht getroffenen Aussage, 
es sei gerade Mittagszeit. Mithin bezeichnet Baumann (2015) die Bedingung 
des Wissens auch als die ,,Unproblematischste“ (S. 36) und ihre spezifischen 
Rahmenbedingungen sollen an dieser Stelle nicht weiter vertieft werden. 


Digitale Daten und die Bedingung der Wahrheit 

Dass Wahrheit und Wahrhaftigkeit bezüglich digitaler Daten jedoch ebenfalls eine 
bedeutende Rolle spielen, wurde bereits mit Blick auf die zuvor besprochene 
Dimension der Richtigkeit der digitalen Daten deutlich (siehe Abschnitt 3.5.1). 


3 Laut Kiefer (1988) ist „der Inhalt des Wissens (...) Information über irgendetwas, (...) 
wobei der Begriff des ontologischen Bereichs am allgemeinsten ist, er kann für alles mögli- 
che [sic] stehen, für Entitäten wie Zahlen, Atome, Götter, Schmetterlinge und Gedanken, um 
einige Beispiele zu nennen“ (S. 70). 
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Hier besteht der Anspruch, dass, unter Annahme einer objektiven Beobach- 
tung und eines präzisen Übersetzungsprozesses realweltlicher Tatsachen in Daten, 
prinzipiell Wahrheiten in diesen Daten dokumentiert sind und sich erkennen las- 
sen. Die digitalen Daten sind somit wichtiger Bezugspunkt von Wissen, auch 
wenn die tatsächliche Wahrheit vermeintlicher Tatsachen in ihrer Bedingung für 
Wissen zwar (noch) nicht zweifelsfrei bewiesen sein muss, so doch aber zumin- 
dest mit gewisser empirischer Evidenz unterfüttert ist: “Something’s truth does 
not require that anyone can know or prove that it is true. Not all truths are esta- 
blished truths” (Ichikawa & Steup, 2018, $ 12, Hervorh. im Orig.). Es kann trotz 
möglicher angesprochener Einschränkungen zumindest generell davon ausgegan- 
gen werden, dass sich auf Grundlage digitaler Daten Wahrheiten erkennen und 
wahrhaftige Aussagen tätigen lassen. 


4.1.2 Die Bedingung der Überzeugung 


Noch wichtiger, insbesondere mit Blick auf den vermeintlichen Erkenntnisgewinn 
aus digitalen Daten, ist die Bedingung der Überzeugung, die auch einen zentra- 
len Bestandteil des in dieser Arbeit analysierten Glaubenssystems zu Big Data 
darstellt (Arisov et al., 2019). Nur wenn man von etwas überzeugt ist, dann kann 
man es auch wissen. Die Bedingung wird bei Ichikawa und Steup (2018) auch 
wie folgt beschrieben: “The general idea behind the belief condition is that you 
can only know what you believe. Failing to believe something precludes knowing 
it” (Ichikawa & Steup, 2018, $ 13). Dabei ist Überzeugung im Rahmen des Wis- 
sens trotz der vorliegenden Umschreibung gerade nicht mit einem Glauben zu 
verwechseln, wie er nachfolgend im Rahmen von Glaubenssystemen thematisiert 
wird. Während Glaube mit Unsicherheit behaftet sein kann und somit mehr oder 
weniger stark ausgeprägt ist, geht es hier eher um ein starkes Für-wahr-Halten. 
Gemeint ist dahingehend also eine Überzeugung, die möglichst absolut ist, also 
keinerlei Zweifel zulässt: Eine Überzeugung zu haben bedeutet, dass eine Person 
annimmt, dass etwas auch tatsächlich der Fall ist (Baumann, 2015). Das heißt, 
dass mit der Überzeugung i. S. v. Wissen nicht lediglich eine hohe Zuversicht 
verbunden sein sollte, sondern eine möglichst absolute Verbindlichkeit. Es wird 
mit Blick auf Wissen auch von einem Full Belief oder Outright Belief gespro- 
chen, der von unterschiedlichen abzugrenzenden Konfidenzebenen unterschieden 
wird: “(...) Having an outright belief is a state of being stably disposed to treat 
p as though it were practically certain” (Wedgwood, 2012, S. 321, Hervorh. im 
Orig.). 
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Digitale Daten und die Bedingung der Überzeugung 

Es ergibt sich wie gezeigt eine besondere Qualität der Überzeugungsleistung von 
Wissensinhalten auf Grundlage digitaler Daten für das Wissen, da sie zumindest 
ihrer Beschreibung nach als Beobachtungen von Tatsachen wahre Begebenhei- 
ten realitätsgetreu abbilden können und somit in der Lage sind, Überzeugungen 
zu nähren, wie etwas wirklich ist. Aus der Sicht eines empirisch lernenden Sub- 
jekts können also digitale Beobachtungsdaten die Bedingung der Überzeugung 
von Aussagen fördern, wenn sie diese faktisch stützen. Dabei ist die Tragweite 
datenbasierter Überzeugung selbstredend in Abhängigkeit situativer Einflüsse zu 
bewerten und wird mithin immer subjektiv evaluiert. Es geht hier jedoch um 
das Potential der digitalen Daten für die Überzeugung von Wissenspropositionen. 
Dieses ist im Sinne von Wissenschaft, die ihr Wissen empirisch auf Grundlage 
gesammelter Daten schafft, durchaus gegeben (Chalmers, 1976). 


4.1.3 Die Bedingung der Rechtfertigung 


Als dritte Bedingung wird in der klassischen Analyse des Wissens die Rechtfer- 
tigung propositionalen Wissens in den Blick genommen. Die Bedingung betrifft 
die Herleitung und Begründung eines Wissensinhalts: 


Why not say that knowledge is true belief? The standard answer is that to identify 
knowledge with true belief would be implausible because a belief might be true even 
though it is formed improperly. Suppose that William flips a coin, and confidently 
believes—on no particular basis—that it will land tails. If by chance the coin does 
land tails, then William’s belief was true; but a lucky guess such as this one is no 
knowledge. For William to know, his belief must in some epistemic sense be proper 
or appropriate: it must be justified. (Ichikawa & Steup, 2018, § 19, Hervorh. im Orig.) 


Die Bedingung der Rechtfertigung wird von Baumann (2015) folglich auch als 
„Nicht-Zufälligkeit“ (S. 37) beschrieben: Dabei geht es nicht um die Zufällig- 
keit des Zustandekommens der Tatsachen, die eine Überzeugung ‚wahr machen‘, 
sondern die Abwesenheit von Anhaltspunkten, auf die eine Person Überzeugungen 
begründet. Diese Zufälligkeit von Überzeugungen kann nicht als Wissen gelten. 


Digitale Daten und die Bedingung der Rechtfertigung 

Wenn zum Wesen von (digitalen) Daten gehört, dass sie Überzeugungen nähren, 
dann müssen sie wiederum auch ebenso dazu dienen können, als Rechtfertigung 
von propositionalen Wissenssätzen herangezogen werden. Wie in Kapitel 3 erör- 
tert, sind die digitalen Daten, die unter den in dieser Arbeit verwendeten Begriff 
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von Big Data fallen, als Beobachtungsdaten zu verstehen. Sie dienen somit als 
die zuvor angesprochenen Anhaltspunkte von Beobachtenden, auf die sich Wis- 
sen über etwas stützen muss, und können mithin als besondere Form von Evidenz 
gelten, die Wissen rechtfertigt. Sie sind, unter der Voraussetzung ihrer Richtigkeit, 
(binär) codiert festgehaltene Beobachtungen von Tatsachen der Welt. 


Die Problematik der Dynamik von Wissen 

Die drei zuvor genannten Bedingungen als Startpunkt der Analyse von Wis- 
sen wurden insbesondere durch die Formulierung des Gettier-Problems (Gettier, 
1963) in Frage gestellt. Gettier stellt darauf ab, dass eine gerechtfertigte wahre 
Meinung auch irrtümlich zustande kommen kann. Sie ist dann zwar wahr und man 
ist überzeugt von dieser Wahrheit. Es gibt auch gute Gründe, die die Annahme 
rechtfertigen, dennoch ist die Aussage aus anderen Gründen als den genannten 
wahr oder wird wahr. Lehrer und Paxson (1969) greifen diesen Einwand auf und 
schlagen hiervon ausgehend vor, Wissen als “undefeated completely justified true 
belief” (S. 225) zu definieren. Der Rechtfertigungsgrund dafür, eine Aussage als 
wahr zu betrachten, darf nicht durch eine andere wahre Aussage abgelehnt oder 
besiegt werden. 

Diese Betrachtung von Wissen lässt somit die Möglichkeit offen, dass ein- 
mal als wahr betrachtete Wissensaussagen auch falsifiziert werden können oder 
angepasst werden müssen, sobald neue Erkenntnisse hinzukommen. Dass die 
Möglichkeit besteht, dass es in meiner Welt einen schwarzen Schwan gibt, 
obwohl ich noch nie einen solchen mit meinen Sinnen unmittelbar beobachtet 
habe, ist also eine lediglich mit Wahrscheinlichkeit behaftete Aussage. Im Sinne 
des kritischen Rationalismus von Popper (1935, 1973) kann daher eine Theorie 
auch nicht final bestätigt werden. Ihr Wert ergibt sich daraus, dass sie zwar Vor- 
hersagen formulieren lässt, die empirisch geprüft werden können, jedoch immer 
die Möglichkeit offengelassen werden muss, dass die durch die Theorie formulier- 
ten Annahmen sowie die Theorie selbst falsifiziert werden können. Auch einmal 
etabliertes Wissen kann veralten oder überholt sein. Die Ansammlung von Beob- 
achtungsdaten ist ein fortlaufendes Unterfangen, so dass neue Beobachtungen 
neue Evidenz zum Wissensbestand hinzufügen können. Wissen und Wissensbe- 
stände sind daher hoch dynamisch (Budin, 1996). Das ist insbesondere aus Sicht 
des wissenden Subjekts eine relevante Eigenschaft des Wissens, da nicht nur 
kritisch beurteilt werden muss, ob Wissensaussagen die genannten Bedingungen 
erfüllen, sondern auch laufend reflektiert werden müsste, ob das einmal erlernte 
Wissen die genannten Bedingungen noch immer erfüllt. 

Auch wenn es durchaus noch weitere relevante Ansätze und Einschränkungen 
bezüglich der theoretischen Konzeption von Erkenntnis und Wissen sowie deren 


54 4 Big Data und Wissen 


Voraussetzungen gibt, bleibt hier zunächst festzuhalten, dass unter der Annahme 
der genannten Bedingungen von Wissen auch das Wissen auf Grundlage von 
digitalen Daten voraussetzungsreich und mitunter durchaus problembehaftet sein 
kann und womöglich diversen Einschränkungen unterliegt. Diese Einschränkun- 
gen liegen sowohl primär auf Seiten der Beschaffenheit der digitalen Daten (bspw. 
bezüglich ihrer Objektivität für die Bedingung von Wahrheit) als auch auf Seiten 
des Wissenden (bspw. bezüglich ihrer Belastbarkeit für die Bedingung von Über- 
zeugung). Es ist fraglich, inwieweit diese auch laufend kritisch reflektiert oder gar 
geprüft werden (können). Sieht man hiervon jedoch zunächst ab und erkennt das 
Wissenspotential an, das digitale Daten durchaus innehaben, muss weitergehend 
auf den zweckdienlichen Charakter von Wissen eingegangen werden. 


4.1.4 Die Unterscheidung von deklarativem Wissen und 
prozeduralem Wissen 


Es gibt daher noch eine weitere wichtige Unterscheidung, die mit Bezug auf 
Wissen allgemein und Wissen auf Grundlage von digitalen Daten getroffen wer- 
den muss und die für den argumentativen Aufbau dieser Arbeit eine zentrale 
Rolle einnimmt. Sie betrifft die Qualität von Wissen mit Blick auf seinen Ver- 
wendungszweck und die Zweckdienlichkeit der digitalen Daten. Bei den großen 
digitalen Datenbeständen handelt es sich zunächst einmal um meist unstruktu- 
rierte Daten, die wie in Abschnitt 3.2 erläutert aus binär codierten Sequenzen 
von Zustandsbeschreibungen bestehen, und folgen mithin dem Shannon’schen 
Informationsbegriff digitaler Daten.* Mit Blick auf die Unterscheidung in dekla- 
ratives und prozedurales Wissen wird hier deutlich, dass das vermeintlich in 
Informationen und Daten enthaltene Wissen ebenfalls unterschiedliche Qualitäten 
hinsichtlich seiner Zweckdienlichkeit besitzt (vgl. M. A. Wirtz, 2017, S. 1835). 
Wenn im Alltag von Wissen gesprochen wird, dann wird meist deklaratives 
Wissen gemeint oder auch Sach- bzw. Faktenwissen. Umschrieben wird das 
ganze häufig als ‚knowing what‘ und wird so u. a. in der Adaptive Control- 
of-Thought-Theorie von J. R. Anderson (1976, 1983) als ein zentrales Modul 
des menschlichen Gedächtnisses betrachtet. Die digitalen Datenbestände, die als 
Informationen aufbereitet sind, können auch als ein solches Fakten- oder Sach- 
wissen bezeichnet werden. Demgegenüber steht das prozedurale Wissen, oft auch 


4 Andere Definitionen folgen einem umgekehrten Verständnis von Information und Daten. 
So definiert bspw. Porat (1977): “Information is data that have been organized and commu- 
nicated” (S. 2). 
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als Handlungswissen bezeichnet, welches das sogenannte ‚knowing how‘ betrifft. 
„Genau genommen versteht man unter prozeduralem Wissen Beschreibungen von 
Verfahren und Prozeduren zur Konstruktion, Verknüpfung und Anwendung von 
(deklarativem) Wissen. Es handelt sich beim prozeduralen Wissen folglich um die 
‚Regeln‘, nach denen Datenstrukturen (also das deklarative Wissen) manipuliert 
werden“ (Reinmann-Rothmeier & Mandl, 2000, $. 323, Hervorh. im Orig.). 
Auch mit Blick auf die digitalen Daten ist nun in deklaratives Wissen und pro- 
zedurales Wissen zu unterscheiden. Es reicht also nicht aus, deklaratives Wissen 
auf Grundlage von digitalen Daten anzusammeln und in Form von digitalen Daten 
zu dokumentieren. Das deklarative Wissen über die in den Daten erkannten Mus- 
ter und Zusammenhänge muss auch verwertet werden und es muss daher gewusst 
werden, wie diese Verwertung konkret aussehen und durchgeführt werden kann. 
Ohne prozedurales Wissen, der Verwertung des deklarativen Wissens, bleibt das 
Wissen der Gesellschaft — ganz allgemein, jedoch hier insbesondere das Wissen 
aus digitalen Daten — unvollständig und ohne Konsequenz. Beide Formen müssen 
daher zusammengebracht und in den allgemeinen Wissensbestand oder in spezifi- 
sche Wissenssysteme? integriert werden. So muss für eine erfolgreiche statistische 
Datenanalyse nicht nur gewusst werden, wann und warum man bspw. eine lineare 
Regression berechnet, sondern auch, wie man diese mit Hilfe einer Datenanalyse- 
software tatsächlich durchführt. Zwar besteht, wie in Abschnitt 3.6 dokumentiert, 
die Hoffnung, dass vor allem die Anwendungen der KI den Zugang zu und die 
Organisation von Daten sowie folglich den hieraus geschöpften Erkenntnisgewinn 
vereinfachen und auf dieser Grundlage bessere Vorhersagen und Entscheidun- 
gen produzieren. Ihre tatsächliche praktische gesellschaftliche Implementierung 
ist jedoch noch nicht allzu weit fortgeschritten. Es fehlen zudem nach einer Erhe- 
bung des Verband der Elektrotechnik Elektronik und Informationstechnik (2019) 
in Unternehmen und Hochschulen allerorts KI-Fachkräfte® und es ist somit noch 
nicht ersichtlich, ob die hohen Erwartungen, die mit dem gesellschaftsweiten Ein- 
satz von KI, vor allem auch mit Bezug auf Wissensarbeit, verbunden sind, auch 


5 Hier ist anzumerken, dass der Begriff der Wissenssysteme an dieser Stelle zunächst allge- 
mein als eine Ordnung von Wissen verstanden wird. In der Informatik werden unter diesem 
Label jedoch bereits wissensverarbeitende Computersysteme verstanden: “Computer sys- 
tems that use knowledge are called knowledge-based systems, or simply knowledge systems” 
(Stefik, 1995, S. XV). Sofern nicht anders vermerkt ist nachfolgend die allgemeinere Bedeu- 
tung gemeint. 

6 Ein überzeugender Hinweis darauf, wie es insbesondere um das prozedurale Wissen über 
datenverarbeitende IuK-Anwendungen einem Hochtechnologieland wie Deutschland bestellt 
ist und der das hier vorliegende Argument stützt, dass die menschliche Komponente im 
Zusammenhang der Wissenserzeugung und -verarbeitung bezüglich digitaler Daten auf 
absehbare Zeit nicht unterschätzt werden sollte. 
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tatsächlich eingelöst werden. Wissen, und hier insbesondere prozedurales Wissen, 
kann und soll mit Hilfe der unterschiedlichen Werkzeuge der IuK verarbeitet und 
verwertet werden; unabhängig, ob dies nun einen einfachen Algorithmus betrifft 
oder eine voraussetzungsreichere KI. Allerdings ist an der Schnittstelle Daten, 
Information und Wissen nach wie vor auch immer noch der Mensch gefragt, der 
um Beschaffenheit, Affordanzen und Verwendung der datenverarbeitenden Werk- 
zeuge wissen muss sowie um die spezifische Qualität der zugeführten Daten. 
Unmittelbarer menschlicher Zugang zu deklarativen und prozeduralen Wissensbe- 
ständen ist und bleibt trotz oder gerade wegen datenverarbeitender IuK zumindest 
auf absehbare Zeit unerlässlich. 

So muss an dieser Stelle konstatiert werden: Von der Fragilität des Wissens 
auf Datengrundlage einmal abgesehen, verfügt kein einzelner Mensch dieser Welt 
über all ihr Wissen. Weder ist er im Besitz des Wissens noch hat er dieses Wis- 
sen internalisiert. Diese Aussage scheint zunächst trivial, führt jedoch zu den für 
diese Arbeit viel wichtigeren Fragen: Welche Beziehung haben die Menschen 
zu einem nicht-internalisierten Wissen? Welche Bedeutung besitzt das Wissen 
für das Individuum und die Gesellschaft? Wie viel Wissen glaubt der einzelne 
Mensch, der derzeit in der vermeintlich digitalisierten Gesellschaft lebt, über eben 
jene Gesellschaft und ihre digitalen Datenbestände zu haben und welche Konse- 
quenzen ergeben sich für ihn aus seinen diesbezüglichen Überzeugungen? Es gibt 
keinen sogenannten ‚Renaissance Man‘, also Menschen, die einen umfassenden 
Überblick über das aktuell verfügbare Wissen besitzen (Jones, 2009). Zwar wer- 
den die Bedeutung und die Vorteile von Generalisten mit breitem Wissensstand in 
einer spezialisierten arbeitsteilig organisierten Welt in letzter Zeit wieder vermehrt 
von der Forschung in den Blick genommen (Epstein, 2019; Melero & Palome- 
ras, 2015). Dennoch bleibt es mit Blick auf den gesellschaftlichen Entstehungs- 
und Verwertungskontext von Wissen und dessen Dynamik unmöglich für das 
Individuum, sich einen umfänglichen Wissenstand zu erarbeiten und zu halten. 
Keine Data Scientists und schon keine einfachen Bürger*innen haben trotz durch- 
aus vorhandener Berührungspunkte einen Überblick über die Datenbestände, die 
Vielfalt der Datenauswertungsmöglichkeiten und das hierdurch generierte Wissen 
über sich selbst und die Gesellschaft. 

Dieses Wissen liegt, wenn überhaupt, in großen Forschungseinrichtungen, 
staatlichen Institutionen und Unternehmen vor und selbst dort nur jeweils in 
Fragmenten. Auch hier gibt es keine zentrale Stelle oder Einheit, von der das 
gesellschaftliche Wissen aggregiert und verteilt wird. Bleibt man bei der Öl- 
Metapher, so sind die Ölfelder und Ölfördertechnik wie auch die digitalen 
Datenbestände und datenanalytische Infrastrukturen auf dieser Erde ungleich ver- 
teilt. Mit dem substantiellen Unterschied, dass Daten in ihrer spezifischen Qualität 
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noch vielseitiger sind als Ol, zeigt sich hier folglich, dass die qualitativen Unter- 
schiede auf Seiten derer, die viele und vor allem hochwertige Daten besitzen, 
und derjenigen, die wenige Daten mit geringer Güte besitzen, noch stärker aus- 
fallen. So bemerken bspw. boyd und Crawford (2012): “The current ecosystem 
around Big Data creates a new kind of digital divide: the Big Data rich and 
the Big Data poor” (S. 674). Andrejevic (2014) spricht daher bezüglich dieser 
Ungleichverteilung auch von einem Big Data Divide (vgl. McCarthy, 2016). 

Es muss also mit Blick auf die vorhergehenden Ausführungen zunächst die 
Möglichkeit offengelassen werden, dass in Daten nicht automatisch Wissen 
steckt und dass man nur eine mehr oder minder gerechtfertigte Überzeugung 
daran haben kann, aus diesen Daten Wissen zu erhalten; von einem eventu- 
ellen individuellen oder gesellschaftlichen Nutzen, der sich hierauf begründet, 
ganz ungeachtet. Dies ist zum einen bedingt durch die zweifelhafte Qualität 
unstrukturierter sowie strukturierter Datensätze, zum anderen durch den weitge- 
hend limitierten Zugang zu den großen digitalen Datenbeständen überhaupt, die 
im Rahmen der weltweiten Nutzung von IuK entstehen. Es bleibt die Feststel- 
lung, dass Erkenntnisproduktion und Wissensgewinn auf Grundlage von Big Data 
aus Sicht des Individuums folglich mit etwaiger Unsicherheit bezüglich ihrer tat- 
sächlichen Konsequenzen für einen Erkenntnisgewinn behaftet sind und hiermit 
verbundene Erwartungen durchaus auch ins Leere laufen können. Die Musterer- 
kennung in digitalen Daten ist mithin oftmals uneindeutig und aufgrund ihres 
primär indirekten und mittelbaren Charakters lediglich eingeschränkt belastbar. 

Dort, wo jedoch weitgehend verlässliches Wissen produziert wird, das den 
zuvor besprochenen Kriterien genügt, wird unter den Vorzeichen der Vorhersag- 
barkeit zukünftiger Entwicklungen und seines Einflusses auf die Gestaltbarkeit 
von Natur, Umwelt und Gesellschaft durch wissensgeleitetes menschliches Han- 
deln ein Nutzen für den Menschen in seiner sozialen Situation realisierbar. 
Diesem vermeintlichen Nutzen und diesbezüglich formulierten gesellschaftlichen 
Erwartungen im Verhältnis zu den großen digitalen Datenmengen widmet sich 
der nun folgende Abschnitt. 


4.2 Die Wissensgesellschaft 


An dieser Stelle ist nun ein grundlegendes Arbeitsverständnis für die Qualität 
digitaler Daten im Allgemeinen und Big Data im Speziellen sowie das Wesen von 
Wissen hergestellt. Dabei ist bereits durchgeklungen, inwieweit etwaige Quer- 
verbindungen bestehen zwischen den digitalen Daten einerseits und andererseits 
ihrem Potential für die Produktion und Speicherung sowie die individuelle und 
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gesellschaftliche Verwertung von Wissen. Diese Verbindung zwischen digita- 
len Datenbeständen und Wissen in ihrem sozio-technischen Kontext muss nun 
auch noch einmal mit Blick auf ihre gesellschaftliche Bewertung explizit benannt 
werden. Es ist gerade ein zentrales Argument der vorliegenden Arbeit, dass es 
gesellschaftliche Diskurse über die vorliegenden Konstrukte Big Data und hier 
insbesondere des Wissens und seiner Nutzung sind, die die gesellschaftliche 
Wahrnehmung digitaler Datensammlung und -verwertung entscheidend prägen. 
Auch das Wissen selbst erfährt in dieser Hinsicht eine ganz besondere Behand- 
lung. Es ist nicht das Wissen an sich und seine eigentliche Funktionsleistung 
bspw. im wissenschaftlichen System, sondern seine gesellschaftliche, vor allem 
medial vermittelte Bedeutung, die im Mittelpunkt steht. Der Wissensbegriff ist 
mittlerweile zu einem zentralen Baustein im gesellschaftlichen Selbstverständ- 
nis geworden, richtet sich jedoch hier in seiner Form eher auf Erwartungen 
und Überzeugungen von Wissen als auf dieses selbst. Dabei erreicht das Wis- 
sen eine so aufgeladene Bedeutung, dass es trotz oder vielleicht auch gerade 
aufgrund seiner Vielschichtigkeit zum Label einer entsprechenden Gesellschafts- 
diagnose gerät, deren Fragen auf die Quantität und Qualität des Wissens und 
deren Konsequenzen für gesellschaftliche Ordnung und Wandel abstellen: die 
Wissensgesellschaft. Diese erlaubt dann aus soziologischer Sicht Antworten auf 
Fragen, die sich für ein besseres Verständnis der sozialen Bedeutung von großen 
digitalen Datenbeständen stellen. 

Der Gesellschaftsentwurf der Wissensgesellschaft liefert dabei nicht nur ver- 
meintliche Erkenntnisse über die Bedeutung von Informationen und Wissen für 
eine gesellschaftliche Organisationsform, also der zentralen Funktion, die dem 
Wissen in der Strukturierung — sprich: der physischen wie auch der kulturellen 
Reproduktion — von Gesellschaft zukommt (Castells, 1996, 1997, 1998; Degele, 
2000). Der Entwurf hat darüber hinaus auch Eingang in den öffentlichen Dis- 
kurs jenseits von Wissenschaft und Ökonomie gefunden. In der Folge ist die 
Wissensgesellschaft eine vermeintlich wirkmächtige Erzählung, die die gesell- 
schaftliche Selbstbeschreibung und Selbstreflexion prägt (Floridi, 2014; Kübler, 
2009; Stehr, 2012). In dieser Erzählung formulierte Erwartungen haben, wie zu 
untersuchen ist, womöglich zentrale Bedeutung für soziales Handeln und müssen 
nun aufgezeigt werden. 

Es finden sich allerdings unzählige Definitionsangebote und Konzeptionen von 
Wissensgesellschaft (vgl. Kübler, 2009, S. 89 ff.).” Gemeinsamer Ausgangspunkt 


7 Diese werden je nach analytischer Schwerpunktsetzung mal in Abgrenzung und mal in 
Überschneidung mit anderweitigen Paradigmen gesellschaftlichen Wandels diskutiert wie 
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ist dabei immer die spezielle Bedeutung, die Wissen für gesellschaftliche Trans- 
formationsprozesse zugeschrieben wird, wobei die Bedeutung von Wissen hier 
unterschiedlicher Natur sein kann. Denn der Wissensbegriff und seine Rolle für 
die Gesellschaft sind an sich erst einmal recht beliebig, kommt doch keine Gesell- 
schaftsform gänzlich ohne Wissen aus. So sind die Feststellungen von Kübler 
(2009) fast schon als Anleitung zu lesen, den vielschichtigen Begriff des Wissens 
und seine mehrdimensionale, spezifische Qualität vor dem Hintergrund seiner 
sozialen Bedeutung nachvollziehbar zu erläutern, weshalb in den vorangegange- 
nen Kapiteln zunächst verdeutlicht werden musste, wie digitale Daten Wissen 
herleiten können: 


Da man sich kaum mehr die Mühe macht, hinreichend zu definieren, was unter 
den Kernbegriffen verstanden wird bzw. sich mit reichlich willkürlicher Tautologie 
begnügt, wie vielfach schon gezeigt worden ist und weiter zu belegen sein wird, 
bemerkt sie indes kaum jemand. ‚Wissen‘ ist zum eindrucksvollen, autoritätshei- 
schenden und Fortschrittlichkeit signalisierenden Paradigma avanciert — was eigent- 
lich für ein so altes und unspektakuläres Wort erstaunlich ist — und wird daher nicht 
nur reichlich wahllos und unreflektiert verwendet, es wird auch beliebig kombiniert, 
damit vergewaltigt, verzerrt und entleert (...). (S. 89) 


Es wird hier also zum einen deutlich, dass es nicht den einen Zugang zur 
gesellschaftlichen Bedeutung von Wissen geben kann und der in dieser Arbeit 
hergeleitete einer von vielen möglichen ist. „Alle Objektivierungsversuche lau- 
fen daher substantiell fehl oder sind allenfalls partiell zutreffend“ (Kübler, 2009, 
S. 194). Das bedeutet zum anderen jedoch auch, dass er als diskursiv anschluss- 
fähiges Konstrukt offenbleibt für individuelle und gesellschaftliche Erwartungen, 
was Wissen nun im Einzelnen für Gesellschaft bedeutet und mit Blick auf 
einen Glauben an Big Data zu diskutieren sein wird (siehe Abschnitt 6.2.2). 
In diesem Zusammenhang hat das Wissen als Gegenstand vor allem im Rah- 
men wissenschaftlicher Diskurse Aufmerksamkeit erfahren. Relevante Fragen 
gesellschaftlicher Wissens- und Forschungsbezüge werden durch Wissenschaft 
aufgegriffen, bearbeitet und Erkenntnisgewinne mittlerweile unter Bedingungen 
und Erwartungen einer zunehmenden Medialisierung und Professionalisierung in 
die Öffentlichkeit zurückgespielt (Eisenegger & Imhof, 2008; Marcinkowski & 
Kohring, 2014; M. S. Schäfer, 2007). 


etwa der Dienstleistungsgesellschaft, der post- oder nach-industriellen Gesellschaft oder 
auch der Risikogesellschaft (Kübler, 2009). 
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Mit Blick auf ein allgemeines Verständnis von Wissen und seines gesell- 
schaftlichen Nutzens wurde hier vor allem der ökonomische Verwertungszusam- 
menhang untersucht, wobei aufbauend auf Heidenreich (2003) vier dominante 
Perspektiven auf die Wissensgesellschaft unterschieden werden. Diese setzen 
dabei jeweils unterschiedliche Schwerpunkte der gesellschaftlichen Konsequenz 
von Wissen für Arbeit und Wirtschaft und leiten entsprechende Analysen an. 
Erstens wird hier ebenfalls auf die auch in dieser Arbeit vielbesprochenen IuK 
abgestellt, die der gesellschaftlichen Produktion, Verteilung und Verwertung von 
Wissen einen entscheidenden Schub gegeben haben. Zweitens wird Wissen „als 
wichtige Ursache wirtschaftlichen Wachstums — neben den klassischen Faktoren 
Kapital und Arbeit — eingeführt“ (Heidenreich, 2003, S. 25). Drittens stehen jene 
Branchen und Unternehmen im Fokus, bei denen Wissen als Ausgangspunkt für 
neue und ökonomisch bedeutungsvolle Dienstleistungen und Produktionsprozesse 
fungiert. In diesem Rahmen wird viertens auch auf die gestiegene Bedeutung 
von flexiblen und lernenden Organisationen, wissens- und kommunikationsin- 
tensiver Arbeit und entsprechend auf ausgebildete Wissens-Arbeitskräfte (bspw. 
sogenannte Data Scientists) eingegangen. An dieser eher ökonomischen Perspek- 
tive auf die Arbeitswelt lässt sich nachvollziehen, wie sich eine gesellschaftliche 
Transformation durch Wissen vor allem auch vor dem Hintergrund ihrer Kon- 
sequenzen für Individuum und Gesellschaften untersuchen lässt. Diesbezüglich 
generierte Erkenntnis unterscheidet sich zwar von aus ihr abgeleiteter erwarte- 
ter Bedeutung der Nutzung von Wissen für die Zukunft, kann sich jedoch auch 
durchaus gegenseitig bedingen. 

Denn unter der Annahme, dass Wissen nun zentral oder womöglich gar kon- 
stitutiv für Gesellschaften heutiger Prägung ist, ist für die vorliegende Arbeit nun 
eben die Perspektive und das Selbstverständnis der Bevölkerung bezüglich des 
eigenen Status als Wissensgesellschaft von Bedeutung. Mit Blick auf die zuvor 
thematisierte Problematik der vermeintlichen Unschärfe bzw. und Inhaltslosigkeit 
des Begriffs 


bleibt die ‚Wissensgesellschaft‘ als vorgeblich neue Formation oder auch nur quali- 
tativer Status ein Mythos. (...) Im wesentlichen [sic] fungiert der Mythos dabei als 
projektive Parabel für kulturell und gesellschaftlich typische bzw. dominante Welt- 
deutungen, seien sie überhöhend, verklärend und/oder simplifizierend, freilich auch 
mit einem Substrat von Wahrhaftigkeit, wonach das Subjekt trotz oder gerade wegen 
der verwirrenden Informationsfülle immer noch strebt. (Kübler, 2009, S. 196) 


Der Nachweis, dass der Mythos der Wissensgesellschaft nun tatsächlich beim 
Subjekt verfängt, ist hiermit jedoch noch nicht erbracht, auch wenn nach Ansicht 
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Küblers (2009) klar ist, dass es vor allem die medial vermittelte Kommunika- 
tion ist, die an Produktion und Verbreitung von Mythen maßgeblich beteiligt 
ist: „Insofern gehen Medien und soziale Mythen mittlerweile in der Tat sehr 
enge, reziproke Beziehungen ein, potenzieren sich ständig weiter und lassen 
vielfach nicht mehr zwischen realer Substanz und imaginativer, projektiver Vir- 
tualität sicher unterscheiden“ (S. 197). Eine empirische Analyse, inwieweit mit 
der Wissensgesellschaft verknüpfte Projektionen tatsächlich in der Bevölkerung 
verfangen und wozu dies führen mag, scheint vor der vermeintlichen Tragweite 
ihrer Konsequenzen daher dringend geboten. 


Die Wissensgesellschaft und der Mythos von Big Data 
Die fundamentale gesellschaftliche Bedeutung des Wissens bietet dabei bild- 
sprachlich den Nährboden, aus dem auch Erwartungen an das Potential großer 
digitaler Datenbestände sprießen könnten. Immerhin fügt sich das Aufkommen 
von Big Data durch seine besondere Beziehung zur Möglichkeit von Wissen, die 
zuvor dokumentiert wurde, nahtlos in die Erzählung zur Wissensgesellschaft ein. 
Anders als beim allgemeinen Wissensbegriff können aus der besonderen Quali- 
tät digitaler Daten abgeleitete manifeste und weitreichende Konsequenzen für die 
Bevölkerung beschrieben werden, wie im nachfolgenden Abschnitt zu zeigen sein 
wird. Das Primat digitaler Daten wird daher vor dem Hintergrund ihrer Bezie- 
hung und Funktion für Wissen betrachtet. boyd und Crawford (2012) heben diese 
zentrale Verbindung auch mit Blick auf den Mythos von Big Data hervor. Dieser 
findet seinen Ursprung im Wissensbezug der Daten: “The widespread belief that 
large data sets offer a higher form of intelligence and knowledge (...)” (S. 663). 
Während das Wissen der Wissensgesellschaft bisher vergleichsweise mühsam 
von Menschen erarbeitet wurde und die IuK lediglich eine eher unterstützende 
und vereinfachende Rolle im Entstehungs- und Verwertungszusammenhang von 
Wissen hatten, ist dieses Verhältnis im Begriff sich zu verkehren. Wie bereits 
an etlichen Stellen angeklungen ist, ist es gerade das Potential weitreichender 
Diffusion der IuK und ihrer Automatisierung, dass diese die Produktion und 
Verwertung von Wissen übernehmen und entscheidend vorantreiben soll. Das 
einstmals Unmögliche wird nun möglich: Der Mensch wird — folgt man der posi- 
tiven Deutung dieser Entwicklung — von den Mühen der Entstehung, Aneignung 
und Anwendung von Wissen entlastet. Denn die höhere Form von Intelligenz und 
Wissen insinuiert bereits die Überlegenheit und somit den Vorrang datenbasierten 
Wissens. 

Es schließen mithin drei Fragen an, die nun nachfolgend zu klären sind: Zuerst 
muss zunächst gefragt werden, in welchem sozialen Zusammenhang digitale 
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Daten nun konkret vermeintliches Wissen bereitstellen und eine gesellschaftli- 
che Erzählung zu datenbasiertem Wissen überhaupt wirkmächtig werden kann. 
Worin bestehen für Individuum und Gesellschaft Zweck und Nutzen dieser Art 
der Wissensgenerierung? Zweitens kann anschließend dann in der Gesamtschau 
der vorliegenden Ausführungen gefragt werden, welche konkrete Resonanz die 
Erzählung der Mythen von Wissen und digitalen Daten womöglich in der Lage ist 
hervorzurufen. Danach schließt sich die dritte Frage an, welche Konsequenzen die 
hierbei gewonnenen Überzeugungen in Situationen haben, in denen der Mensch 
Einschätzungen bezüglich wissensverarbeitender Anwendungen vornimmt, die 
auf eben jene großen digitalen Datenbestände zugreifen. 
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Big Data und Wissen über 5 
Gesellschaft - die Quantifizierung des 
Sozialen 


Auch wenn der erwartete Nutzen im Rahmen der Bedeutung des Wissens bereits 
durchgeklungen ist, muss die Verbindung der zentralen Elemente der vorliegen- 
den Untersuchung, des Erkenntnis- und Nutzengewinns, vor dem Hintergrund der 
öffentlichen Wahrnehmung digitaler Datenverwertung erläutert und veranschau- 
licht werden. So ist an dieser Stelle zunächst die Bedeutung von Wissen mit 
Fokus auf Big Data vor aktuellen gesellschaftlichen Entwicklungen und hiermit 
verbundenen Nutzenerwartungen zu erörtern. Diese Nutzenerwartungen sollen 
hierbei mit Blick auf datenverarbeitende Wissensanwendungen anhand zweier 
Ebenen verdeutlicht werden: der Nutzen für das Individuum und der Nutzen für 
die Gesellschaft. 

Dabei muss nun auch der Datenbegriff noch einmal aufgegriffen und prä- 
zisiert werden. Es ist nicht irgendeine Funktion der Daten und es sind auch 
nicht irgendwelche digitalen Daten, die hier mit Blick auf das Soziale relevant 
sind, sondern ihr Funktionsbezug der Bewertung und Verwertung. Digitale Daten 
ganz allgemein und nur für sich betrachtet sind zunächst nicht zwingend nume- 
rische Wertzuweisungen. Auch Texte, Bilder oder audiovisuelle Medien fallen 
zunächst unter den Datenbegriff, da sie mit Hilfe numerischer Werte in einer 
binär codierten Sequenz von Zustandsbeschreibungen von den IuK gespeichert 
und verarbeitet werden. Wenn allerdings im Zusammenhang mit Big Data als 
sozialem Phänomen von einer Datafizierung, Metrifizierung oder auch Quanti- 
fizierung der Gesellschaft oder des Sozialen gesprochen wird (Filipović, 2015; 
Holtzhausen, 2016; Mau, 2017; Merry, 2016; Passoth & Wehner, 2013; М. Т. 
Schäfer & van Es, 2017)!, dann betrifft dies die Überführung realweltlich zu 
beobachtender Phänomene materieller oder immaterieller Natur in digitale Daten 


! In der vorliegenden Arbeit wird dem Begriff der Quantifizierung (des Sozialen) Vorzug 
gegeben, da unter Metrifizierung auch die Einführung metrischer Einheitssysteme verstanden 
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mit dem vorrangigen Ziel, diese so digitalisierten Entitäten zählbar voneinan- 
der unterscheidbar und somit vergleichbar sowie bewertbar zu machen (Hubbard, 
2010). Der Zusammenhang der Bewertung und hiermit verbundener Vergleichung 
stellt dann neue Informationen über die Welt bereit, die Eingang in Wissens- 
systeme finden können. Auf diesem Wege kann nicht nur der Wissensbegriff 
mit Leben gefüllt werden, sondern gleichzeitig unter dem Vorzeichen einer 
gesamtgesellschaftlichen Bedeutung von Wissen auch dessen Nutzen diskutiert 
werden. 

Quantifizierung meint hierbei zunächst eine Übersetzungsleistung oder wie 
Mau (2017) verdeutlicht: „Phänomene, Eigenschaften oder Beschaffenheiten 
eines Sachverhalts werden in einer allgemeinen, abstrakten und universell 
anschlussfähigen Sprache repräsentiert, der der Mathematik“ (S. 27). Daten ent- 
stehen hier vor allem auch durch das Messen, also einer proaktiven? Erhebung 
von Daten, bei der entsprechend ein empirisches Relativ in ein numerisches Rela- 
tiv überführt wird (Rössler, 2017; Schnell et al., 2018). Hierbei wird im Rahmen 
der Messung ein vorher festgelegtes Regelwerk herangezogen, so dass Mes- 
sen konkret auch wie folgt verstanden wird (Stevens, 1946): “The assignment 
of numerals to objects or events according to rules” (S. 677). Allerdings geht 
es zumindest im Rahmen sozialwissenschaftlicher Fragestellungen genauer um 
die Eigenschaften der beobachteten Objekte oder Ereignisse, denen Zahlenwerte 
zugewiesen werden (Bandalos, 2017; Hand, 2016). Dabei trägt wie in Kapitel 3 
dokumentiert die Verbreitung von IuK und ihre stetige Präsenz in der sozialen 
Situation einen gewichtigen Teil zu dieser Quantifizierung bei. 

Doch die bloße Möglichkeit der Übersetzung in das digitale Datenformat sagt 
noch nichts über dessen tatsächliche Notwendigkeit aus, Entitäten zu digitalisie- 
ren und in diesem Moment mit Zahlenwerten zu belegen. Selbst wenn, wie in 
Kapitel 4 dargelegt, Wissen als ein Wert an sich betrachtet wird und die Wis- 
sensgesellschaft sich die Produktion, Organisation und Verwertung von Wissen 
zur Aufgabe gemacht hat, ist diese Erklärung zunächst noch nicht hinreichend. 


wird und Datafizierung vor allem auf den technischen Ubersetzungsprozess von Entitäten in 
Daten abstellt. 


2 Hierzu ist anzumerken, dass die Ubersetzungsleistung zwar aktiv angeregt muss, also den 
ШК per Command-Zeile befohlen wird. Allerdings ist hiermit jedoch noch nicht verbunden, 
dass sich auch bewusst für die Messung entschieden wurde. Die Registrierung von digita- 
len Repräsentationen der Subjekte und Objekte sowie von Ereignissen, Orten und Zeiten 
geschieht laufend und beiläufig, weshalb der Begriff der Messung hier zunächst weiter zu 
fassen ist, als in der standardisierten empirischen Sozialforschung (zu diesem Messbegriff 
siehe Abschnitt 8.1). Die Messung im vorliegenden Sinne ist also nicht zwingend systema- 
tisch und zielgerichtet, doch auf jeden Fall nicht-zufällig. 
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Wie angemerkt, muss insbesondere der Nutzen in den Blick genommen wer- 
den, der aus diesem Wissen gezogen wird. Es ist daher notwendig, auf die 
besondere soziale Qualität und hierbei die spezifische gesellschaftliche Affor- 
danz des Wissens abzustellen, um zu verdeutlichen, warum und wie individuelle 
und gesellschaftliche Nutzengewinne imaginiert und idealisiert werden. Erst die 
sich ergebenden Möglichkeiten der Unterscheidung, der Bewertung und eines 
anschließenden Vergleichs weisen auf den Nutzengewinn durch die weitreichende 
Quantifizierbarkeit sozialer Phänomene hin, die sich aus den vielfältigen Mög- 
lichkeiten der Generierung von Daten im Rahmen der eingangs besprochenen 
Digitalisierung ergeben. Dieses Verhältnis von sozialer Quantifizierung und Nut- 
zengewinn vor dem Hintergrund gesellschaftlicher Vergleichslogik bedarf daher 
näherer Betrachtung. Hierbei ist die zuvor aufgemachte Perspektive individueller 
und gesellschaftlicher Nutzenerwartungen eng miteinander verwoben und folgt 
nun zunächst einem übergeordneten Argument, in dessen Rahmen sich beide nicht 
immer voneinander trennen lassen. 


5.1 Zur Bedeutung von Zahlen im sozialen Kontext 


Zunächst ist hier auf die generelle soziale Bedeutung von Zahlen abzustellen. 
Der Wissenschaftshistoriker Cohen zeigt in seiner geschichtlichen Abhandlung 
The Triumph of Numbers (2006), wie Zählen und Messbarmachen sich aus euro- 
zentrischer Perspektive im Zeitverlauf entwickeln und zu Beginn vor allem zur 
nationalstaatlichen und wissenschaftlichen Entwicklung beigetragen haben. Die 
(Sozial-)Statistik sorgte dafür, die allgemeine Anwendbarkeit und den Nutzen 
von Zahlen und mathematischen Bezügen zu demonstrieren und zum Durchbruch 
auf breiter gesellschaftlicher Ebene zu verhelfen. Dabei wurde bereits vielfach 
die Entwicklung und Bedeutung der Verwendung von Zahlen und Statistiken für 
die Herausbildung des modernen Nationalstaats nach westfälischer Staatenord- 
nung hervorgehoben (Crook & O’Hara, 2011; Desrosiéres, 1998; Hacking, 1990; 
MacKenzie, 1981; Т. М. Porter, 2011; Rottenburg et al., 2015). „Das quantitative 
Wissen über Territorium und Bevölkerung stellt seit jeher eine wesentliche Vor- 
aussetzung staatlicher Handlungskapazität [sic], denn erst wenn Dinge benannt 
und statistisch erfasst worden sind, können sie zum Gegenstand politischer Inter- 
ventionen werden“ (Mau, 2017, $. 186-187). Mit Hilfe der Auszählung bspw. von 
männlichen Rekruten und ihrer physischen Verfasstheit ergab sich die Möglich- 
keit der präzisen militärischen Organisation und Planung. Es konnte abgeschätzt 
werden, wie viele Soldaten im Kriegsfall zur Verfügung standen, worauf sich 
Ausrüstung und Logistik einzustellen hatten, wie umfangreich die Finanzierung 
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(Stichwort: Steuern) auszusehen hatte und es war ein Vergleich mit den Heeren 
anderer Länder möglich (Cohen, 2006). Die Vorteile, die sich aus dem Wissen 
dieser Daten ergaben, gingen einher mit der Einrichtung staatlicher Institutionen 
zur kontinuierlichen Datenerhebung und -auswertung. Es entstand ein weitrei- 
chender Verwaltungsapparat, da man nunmehr regionale Gebiete als eine Einheit 
zusammenfassen musste, um einen geografischen Raum und die in ihm lebenden 
Merkmalsträger erfassen zu können. Die Vorzüge der quantitativen Erfassung von 
Phänomenen im Rahmen von Bestandsaufnahme und Planung waren also eng ver- 
knüpft mit (politischer) Handlungsmacht und führten dazu, dass diese fortan auf 
weitere Gesellschaftsbereiche ausgedehnt wurde. 


Qualitative Wertzuweisungen innerhalb der quantitativen Logik 

Dabei erlauben Zahlen nicht nur eine quantitative Beschreibung im Sinne des 
Auszählens, sondern können nach der Logik der Messung und der Unterschei- 
dung zwischen den Messniveaus auch qualitative Eigenschaften betreffen und 
dokumentieren. Die Qualität von etwas wird im Rahmen einer Valenzzuord- 
nung positiv oder negativ beschrieben, so dass eine qualitative Bewertung auch 
als „evaluatives Einsortieren in Dualismen, Rangfolgen und Skalen“ (Reck- 
witz, 2017, S. 66, Hervor. im Orig.) verstanden werden kann, anhand dessen 
Wertzuweisungen unterschieden und zueinander in Beziehung gesetzt werden 
(Vormbusch, 2012). 

Bewertungen auf Basis quantitativer Wertzuweisungslogik eröffnen durch die 
vorgeblich saubere mathematische Ordnung der Umwelt einen rationalen und 
übersichtlichen Zugang zu dieser (Mau, 2017) und gehen einher mit einem 
weitgefassten Bestreben nach formaler taxonomischer Ordnung sowie Standardi- 
sierung (Higgins & Larner, 2010; Timmermans & Epstein, 2010). So durchzieht 
das kontinuierliche Abzählen und Wertzuweisen durch Quantifizierung mittler- 
weile alle gesellschaftlichen Bereiche (Lamont, 2012; Power, 1997): Wie in 
Kapitel 3 deutlich geworden ist, sind es mithin bei weitem nicht nur staatliche 
Institutionen, die im Rahmen einer staatlichen Steuerungslogik für alles Mögliche 
Daten erheben, oder im Rahmen einer ökonomischen Verwertungslogik agierende 
Unternehmen, die Produktion, Absatz und Konsum von Produkten und Dienstleis- 
tungen verdaten und optimieren. Auch auf der Ebene des Individuums wird das 
Selbst im Rahmen des Self-Trackings der laufenden Datenerhebung unterworfen 
(siehe Abschnitt 3.3). Den vermeintlichen Nutzen gesellschaftlicher Quantifizie- 
rung in den Blick nehmend, wird mithin auf den funktionalen Charakter digital 
quantifizierter Wertzuschreibungen abgestellt werden, der Unterscheidungen des 
Disparaten ermöglicht (Nassehi, 2019). Hier sind unlängst etliche soziologische 
Erklärungsansätze entstanden, die allesamt auch auf die durch digitale Daten 
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bedingte Unterscheidungs- und Vergleichslogik abstellen und die vorliegende 
empirische Analyse der Erkenntnis- und Nutzenerwartungen bezüglich digitaler 
Daten argumentativ vorbereiten (Heintz, 2010, 2016; Mau, 2017; Nassehi, 2019; 
Reckwitz, 2017). 


5.2 Zahlen als Grundlage von Bewertungen und 
Vergleichen 


Heintz (2010, 2016) folgend begründen sich Phänomene wie Metrifizierung, 
Quantifizierung, Datafizierung auf einer Soziologie des Vergleichs. Werden Enti- 
täten mit Zahlen belegt und bewertet, können eigentlich inkommensurable Dinge 
durch Überführung in ein numerisches Format vergleichbar und wie zuvor aus- 
geführt leichter kategorisiert sowie hierarchisiert und somit in eine Wert- und 
Präferenzordnung überführt werden. Zum einen werden also Entitäten durch die 
Zuordnung von Zahlen und dadurch expliziten Wertzuweisungen zunächst als 
prinzipiell vergleichbar angesehen und zum anderen dann dennoch durch die 
bezifferte Wertigkeit unterschieden. Oder wie Heintz (2016) ausführt: 


Vergleiche beruhen also auf zwei Operationen, die empirisch zwar zusammenlau- 
fen, analytisch aber zu unterscheiden sind: auf der Einstufung der Vergleichsobjekte 
als vergleichbar (Kategorisierung) und auf der Feststellung ihrer (graduellen) Dif- 
ferenz anhand eines tertium comparationis. Es ist diese Kombination von Gleich- 
heitsunterstellung und Differenzbeobachtung, die die Besonderheit von Vergleichen 
ausmacht. (S. 307, Hervorh. im Orig.) 


So wird der Vergleich, den die Sozialwissenschaften als methodischen Ansatz 
der Empirie kanonisiert haben, zur sozialen Praxis (Heintz, 2016). Denn dieser 
Vergleich ermöglicht und fördert zum einen insbesondere eine Statusbestim- 
mung innerhalb der nunmehr sichtbar gemachten Strukturen und dient somit 
der vereinfachten Feststellung sowie Selbstvergewisserung und hierauf aufbau- 
ender Optimierung von (Eigen-)Wert. Zunächst ist diese Praxis allgemein vor 
dem Hintergrund der Rationalität von Präferenzordnungen eines sich selbst als 
Homo Oeconomicus beschreibenden nutzen-maximierenden Menschen zu bewer- 
ten (Kirchgässner, 2013). Aus der Vergleiche ermöglichenden Sozialkalkulation 
kann in der kapitalistischen Moderne ein Profit generiert werden, etwa wenn 
die unterschiedliche Leistung und Leistungsfähigkeit von Arbeitskräften von 
den Human Resources zueinander in Bezug gesetzt werden (Vormbusch, 2012). 
Insbesondere mit Blick auf das Subjekt und seine Identität findet diese dann 
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jedoch auch im Rahmen eines Impression Managements im Rahmen von Online- 
Kommunikation Anwendung, wenn Selbstbild und -wert anhand der Anzahl 
virtueller Freunde und sogenannter Likes festgemacht werden.’ 

Reckwitz (2017) unterscheidet mit Blick auf die von ihm analysierte Gesell- 
schaft der Singularitäten, in der die Unterscheidungen des Allgemeinen und 
Besonderen zentrale Kategorien darstellen, in vier Sorten von Praktiken. Bezüg- 
lich der angesprochenen Vergleichslogik ist auch hier insbesondere das Bewerten 
und weiterhin das Hervorbringen von Wertordnungen kalkulativer Praxis im 
Rahmen der Quantifizierung des Sozialen von Interesse. Dieses ist jedoch eng 
verknüpft mit dem vorhergehenden Beobachten und dem nachfolgenden Aneig- 
nen. Hierzu merkt Reckwitz (2017) an: „Die vier genannten Sorten von Praktiken 
sind nur heuristisch zu trennen, denn es ist möglich, dass sie eng miteinan- 
der verzahnt sind oder sogar miteinander kombiniert auftreten (so dass etwa in 
der gleichen Praxis hergestellt und rezipiert wird). Sie können auch hochgra- 
dig spezialisiert und ausdifferenziert nebeneinanderstehen und sich zu ganzen 
institutionellen Komplexen verdichten“ (S. 64, Hervorh. im Orig.). Als ein sol- 
cher institutioneller Komplex ist die Quantifizierung des Sozialen mit Hilfe von 
Digitaltechnik zu verstehen. 

Auch wenn der Ansatz von Statuseinschätzung und Selbstvergewisserung 
sowie anschließender Verwertung womöglich nicht zu einer umfassenden und 
abschließenden Erklärung taugt, da diese selbst etwa unter den Vorzeichen über- 
geordneter kapitalistischer oder anderweitiger idiosynkratischer Logiken erklä- 
rungswürdig sind:* Die Konsequenz ist, dass ein jeder, der einen irgendwie 
gearteten Nutzen aus der Mustererkennung und der eigenen Positionsveror- 
tung mittels vergleichender Bewertung ziehen möchte, sich selbstredend selbst 
der Logik der umfassenden und standardisierten Evaluation unterwerfen muss 
und somit das Fortschreiten der gesellschaftlichen Prozesse dieser Valorisie- 
rung begünstigt (Lamont, 2012; Muniesa, 2012; Reckwitz, 2017). Wie Mau 
(2017) diesbezüglich resümiert: „Permanente Vermessung und Bewertung füh- 
ren dazu, dass sich sowohl die Fremd- als auch die Selbststeuerungsleistungen 
intensivieren“ (S. 13). 


3 Zum allg. Zusammenhang von Status und Identität allgemein siehe Abels (2017), insb. 
Abschnitt 22.3. Mit Fokus auf virtuelle Online-Welten siehe Chester und Di Bretherton 
(2009), Fullwood (2019) sowie Laurent und Bouzefrane (2015). 

4 Die spezifische funktionale Logik von Wissen um Bewertung und Vergleich ist immer 
situativ im jeweiligen Verwertungszusammenhang zu verstehen. Siehe z. B. die Bedeutung 


von Vergleichshorizonten und Nutzungsmotiven im Zusammenhang mit Gamification (Sai- 
ler, 2016). 
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Eine einmal festgestellte (Un-)Gleichheit informiert dann mithin Anschluss- 
handlungen als Reaktion auf die Differenzbeobachtungen, die aus der jeweiligen 
inhärenten situativen Vergleichslogik folgen. Beispielhaft zeigt sich dann im 
Spitzensport und der Wirtschaft, wer gerade zur Leistungselite zählt, in Kunst 
und Kultur kann festgestellt werden, welche Kunstschaffenden, Stile oder Werke 
gerade en vogue sind, und auch in der von der Wählergunst abhängigen Poli- 
tik zeigt sich, welche politischen Programme und Personen aktuell reüssieren. 
Diesbezügliche Erkenntnisse lassen sich auch und insbesondere unter den Vorzei- 
chen der Ökonomie recht wechselhafter Aufmerksamkeit (Franck, 1998; Schroer, 
2014) entsprechend verwerten. So erhält der Hollywoodstar mit den meis- 
ten Likes den lukrativen Werbevertrag. Oder man ist vielleicht auch einfach 
nur eher geneigt ein Buch zu lesen, das bei eben jenen Leuten populär ist, 
die auch den eigenen Lieblingsroman positiv bewertet haben. In Analogie zu 
den zuvor beschriebenen Algorithmen werden die festgestellten Unterscheidun- 
gen und Bewertungen folglich im Rahmen von Entscheidungsprogrammen zur 
Lösung bereichsspezifischer Probleme herangezogen. Es kann dann vom Modus 
einer Zustandsfeststellung in den Modus des zielgerichteten Handelns mit dem 
Ziel der Zustandsveränderung gewechselt werden. 


5.3  luK als Motor globaler Vergleichshorizonte 


Zunächst ist jedoch näher auf die IuK als Motor globaler Vergleichshori- 
zonte einzugehen. IuK und die durch sie produzierten digitalen Daten eignen 
sich hierbei aufgrund ihrer immanenten mathematischen Übersetzungsleistung 
besonders auch für einen zu automatisierenden fortlaufenden Einsatz im Funk- 
tionszusammenhang der gesellschaftlichen Quantifizierung. Sie wirken somit 
vereinfachend auf die umfangreiche Fortentwicklung und Ausbreitung gesell- 
schaftlicher Quantifizierung des Sozialen, da sie in besonderem Maße den an 
diesen Vergleichszusammenhang gestellten Anforderungen genügen: 


Das Entstehen eines überlokalen, universalistischen Vergleichszusammenhangs setzt 
1) die kontinuierliche Produktion öffentlicher Vergleichsereignisse voraus, denn nur 
dann kann kontinuierlich verglichen und laufend zwischen unterschiedlichen Ver- 
gleichsresultaten differenziert werden; sie setzt 2) die Herstellung von Vergleichbar- 
keit dieser Vergleichsereignisse jenseits ihrer lokalen Entstehungskontexte voraus, 
denn nur was unter bestimmten Gesichtspunkten plausibel als gleich beschrieben wer- 
den kann, kann unter anderen Gesichtspunkten plausibel als ungleich beschrieben 
werden; schließlich setzt es 3) die Etablierung von Vergleichskriterien voraus, die die 
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Ereignisse in einen übergreifenden Vergleichszusammenhang integrieren. Gleichzei- 
tig wird damit die Möglichkeit geschaffen, Ereignisse auf einer Zeitachse einzuord- 
nen und sie mit anderen, vergangenen und zukünftigen Vergleichen in Beziehung zu 
setzen. (Heintz & Werron, 2011, S. 365) 


So zeigt sich auch diesbezüglich die vermeintliche Leistungsfähigkeit digita- 
ler Technik und hiermit einhergehender Entstehung und Verwertung digitaler 
Daten. Anstatt, dass Unterscheidungen und hierauf aufbauende Vergleiche lau- 
fend durch den Menschen getroffen und verarbeitet werden müssen, wird die 
kalkulative Praxis an die IuK ausgelagert und durch datenverarbeitende Algorith- 
men in standardisierter Form festgeschrieben, was eine gleichbleibende Qualität 
der Vergleiche in Datenform, ihrer Verarbeitung und der produzierten Ergebnisse 
verspricht. Mit der Konsequenz, dass dieses ‚Erfolgsmodell‘ selbstredend auch 
Vergleiche jenseits nationalstaatlicher Grenzen zulässt oder vielmehr erfordert. 

Die Logik von Wertzuweisungs- und Vergleichsprozessen gepaart mit den Nut- 
zungsmöglichkeiten der IuK hat eine grenzüberschreitende Anziehungskraft und 
die Durchsetzung des Vergleichs ist diesbezüglich auch als Voraussetzung und 
Treiber von Globalisierungstendenzen zu analysieren und kann zum Verständnis 
von global übergreifenden Entwicklungen in unterschiedlichen gesellschaftlichen 
Feldern herangezogen werden (Bühler & Heintz, 2017; Heintz, 2012; Heintz & 
Werron, 2011). Wie bereits aufgezeigt, ist der Preis für Einsichten der verhei- 
Bungsvollen Selbstverortung für alle Teilnehmenden gleich und besteht in einer 
Unterwerfung unter das Regelwerk von Standardisierung und Quantifizierung, das 
individuelle Eigentümlichkeiten ignoriert (Mau, 2017). So demonstrieren Heintz 
und Werron (2011) die Möglichkeit von Globalisierung durch die Entstehung 
globaler Vergleichshorizonte insbesondere am Beispiel der Wissenschaft und des 
Spitzensports. Doch gibt es auch in vielen anderen gesellschaftlichen Teilberei- 
chen mittlerweile global institutionalisierte Vergleichslogiken (Blank, 2007; Erdi, 
2019; Espeland & Sauder, 2007; Ringel & Werron, 2019; Sauder & Espeland, 
2009). 

Damit Vergleiche hier ihre globalgesellschaftliche Wirkmächtigkeit entfalten 
können, müssen sie zunächst weitläufig kommuniziert werden. Der Vergleich darf 
also nicht nur auf der mentalen Ebene verbleiben, sondern muss in einer sozialen 
Situation durch Kommunikation Eingang finden (Heintz, 2016). Denn nur, wenn 
Wissen um Differenz auf Grundlage eines Vergleichs dem breiten öffentlichen 
Diskurs zugeführt wird, entfaltet er gesellschaftliche Folgen. So blieben Hoch- 
schulrankings folgenlos, wenn nur wenige oder gar niemand von ihnen lesen 
oder erfahren würde, wenn sie also keinen Eingang in die mediale Berichterstat- 
tung oder die externe Kommunikation der Hochschulen selbst fänden (Heintz & 
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Werron, 2011). Erst wenn sie der öffentlichen Debatte zugeführt werden, Кбп- 
nen sie Bedeutung erhalten und führen dazu, dass Studierende, Forschende und 
andere Beteiligte sich in ihrem Handeln an ihnen orientieren. Dies drückt sich 
dann bspw. in der Entscheidung aus, sich aufgrund eines festgestellten Unter- 
schieds in der Qualität von Forschung und Lehre an Hochschule A zu bewerben 
und nicht an Hochschule B. 

Vor allem Entwicklungen auf der technologischen und organisationalen 
Ebene — und hier insbesondere die internationale Ausweitung massenmedialer 
Kommunikation — begünstigten die Ausdehnung von Vergleichshorizonten. Ein 
illustratives Beispiel für die Verbreitung der Vergleichslogik im Sport liefern 
Heintz und Werron (2011) selbst: 


Die ‚epochale‘ Leistung der Telegraphie bestand dabei darin, ein Kommunikations- 
netz bereitzustellen, mit dessen Hilfe sich Beobachtungs- und Beschreibungsknoten 
wie Sportverbände oder Presseredaktionen einrichteten, wo Wettkampfinformatio- 
nen zusammengeführt, notiert, gesammelt, verglichen, evaluiert und, für unser Argu- 
ment entscheidend, publiziert wurden mit der Folge, dass nunmehr die gleichzeitige 
Informiertheit aller Ausübenden und Interessierten einer Sportart unterstellt werden 
konnte. (...) Die Allianz aus Presse und Telegraphie war insofern stilbildend für eine 
auch heute noch gültige Kombination aus elektrischen Kommunikationstechnologien 
und statistisch-narrativer öffentlicher Evaluation, die von weiteren Medien und For- 
men der Berichterstattung im 20. Jahrhundert nur noch ausgeweitet und verfeinert 
werden konnte. (S. 378-379) 


Die vorhergehenden Ausführungen verdeutlichen, dass sich der inhärente Nut- 
zen dieser gesellschaftlichen Verständigung über Quantifizierung aus den aus ihr 
entspringenden Möglichkeiten einer globalen Bewertungs- und Vergleichslogik 
ergibt. Diese erlaubt die Verortung von Subjekten und Objekten sowie räumlicher 
und zeitlicher Ereignisse innerhalb individueller oder bereichsspezifischer Werte- 
und Präferenzordnungen. Es lässt sich daher leicht erahnen, welchen Schub die 
Möglichkeiten vernetzter IuK in den globalen Vergleichszusammenhängen der- 
zeit entfalten. Die kalkulative Vergleichslogik diffundiert dabei nicht nur global 
in alle Sphären öffentlichen und privaten Lebens, sondern findet in diesem Rah- 
men wie gezeigt auch Eingang in gesellschaftliche Kommunikationsprozesse. Im 
Zuge der globalen Digitalisierung wird die Möglichkeit umfassender Ausdehnung 
der Bewertungs- und Vergleichshorizonte durch die Quantifizierung des Sozia- 
len als Grundlage von Steuerungs- und Optimierungsprozeduren hier nun auch 
zum Anspruch umformuliert und verkehrt sich so womöglich zu einer kollektiven 
Erwartungshaltung. 
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5.4 Die Wahrnehmung großer digitaler Datenbestände 
vor dem Hintergrund der Quantifizierung des 
Sozialen 


Im Rahmen der Ausdehnung der Quantifizierung des Sozialen und der Ent- 
stehung und Verwertung entsprechender digitaler Datenbestände wird in der 
Literatur vielfach diskutiert, inwieweit die zuvor skizzierten Entwicklungen nun 
auch menschliche Vorstellungen von Realität und sozialer Wirklichkeit for- 
men. In einem nun nachfolgend zu beschreibenden Wahrnehmungsmuster von 
Big Data fügen sich die in den vorangegangenen Kapiteln angesprochenen 
Ausführungen zusammen und es wird herausgearbeitet wie eine entsprechende 
Wahrnehmung aussehen und welche Folgen für eine Erwartungshaltung bezüglich 
der Quantifizierung sie haben Könnte. 


Wahrnehmung und Konsequenzen kalkulativer Praktiken 
Vormbusch (2012) postuliert zunächst ganz allgemein zur Konsequenz kalkulati- 
ver Praxis: „Welche Vorstellungen gesellschaftlicher Wirklichkeit realitätsmächtig 
werden, ist auch durch den historisch spezifischen Gebrauch organisierter Zahlen- 
systeme bestimmt. Mit diesen werden jeweils bestimmte Handlungsmöglichkeiten 
und -restriktionen etabliert, entlang derer soziale Akteure ihre Strategien und 
Möglichkeiten ausloten“ (S. 20). Es wird im Rahmen kalkulativer Praktiken 
wie institutionalisierter Messverfahren und hierauf fußender Wertordnungen wie 
Rankings in der Folge soziales Anpassungsverhalten beobachtet: Espeland und 
Sauder (2007) sprechen diesbezüglich auch von Reaktivität, Mackenzie (2006) 
von Performativität und Hacking (2007) von dynamischem Nominalismus. 

Mau (2017) überträgt diese Reaktionen und ihre Konsequenzen anschaulich 
auf die Folgen der Quantifizierung des Sozialen im Rahmen von Big Data: 


Mit der Verfügung über immer mehr Daten begibt sich die Gesellschaft auf den Weg 
zu einer datengetriebenen Prüf-, Kontroll- und Bewertungsgesellschaft, die nur noch 
das glaubt, was in Zahlen vorliegt. Soziale Selbsterkenntnis und Regulierung beziehen 
sich inzwischen so intensiv auf Daten, dass das Erkennen dessen, was ist, ohne sie 
kaum mehr möglich erscheint. (S. 46) 


5 In der Konsequenz auf diese Beobachtungen formuliert Campbell (1979) folgendes Gesetz: 
“The more any quantitative social indicator is used for social decision-making, the more 
subject it will be to corruption pressures and the more apt it will be to distort and corrupt the 
social processes it is intended to monitor” (S. 85). 
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Eine durch Big Data geprägte Weltsicht kann dahingehend charakterisiert wer- 
den, als dass in der durch IuK angetriebenen kalkulativen sozialen Praxis der 
Quantifizierung des Sozialen überaus großes Potential für Erkenntnis- und Nut- 
zengewinne gesehen wird. Diese Weltsicht ist also durch eben jene Potentiale von 
Big Data geprägt, die in Abschnitt 3.5 im Rahmen der sozio-technischen Betrach- 
tung digitaler Datenbestände als konsequentiell-evaluative Dimensionen von Big 
Data besprochen wurden. Die zuvor thematisierten Versprechungen und Ideal- 
vorstellungen der Qualitäten von digitalen Daten werden dabei kommunikativ 
weiterverbreitet und weitgehend von der Bevölkerung übernommen. Ein Mythos 
lebt mithin davon, dass man ihn sich selbst und anderen immer wieder erzählt 
und seine wesentlichen Aussagen dabei beständig und affirmierend wiederholt 
werden (Barthes, 1964). 

Der Mythos Big Data bezieht sich in seiner originären Beschreibung bei boyd 
und Crawford (2012) zunächst lediglich auf die epistemische Qualität der Daten 
und ihre Konsequenz für die Möglichkeiten von Wissen. 


Big data, it is implied, is the source of a different order of knowledge, a step change in 
human self-understanding that precisely bypasses humans’ meagre attempts at self- 
understanding through interpreting the local details of what they think, say and do. 
(Couldry, 2017, S. 235) 


Die besondere Qualität von Big Data baut also auf der in Abschnitt 4.2 angespro- 
chenen Bedeutung von Wissen und dessen funktionalem Potential für prozedurale 
Steuerung auf. Gefragt wurde hier jedoch zunächst nach den Möglichkeiten digi- 
taler Daten für Wissen, nicht nach den Erwartungen, die der Mythos womöglich 
evoziert. Diesbezüglich thematisiert Degele (2000) im Zusammenhang mit der 
Computerisierung womöglich 


tiefgreifende Folgen (...) im stillen Wandel der Konstituierung von Wissen. (...) Im 
Zuge dessen werde sich eine neue Wissensordnung ausbilden, in welcher sich ein 
spezifischer, datenerzeugender Denkstil mit überwiegend flachem (Rohstoff-)Wissen 
in Wissenschaft und Gesellschaft ausbreiten werde. Das reine Datenwissen gewinne 
damit eine erstrangige Bedeutung und lege die Ausbildung einer spezifischen Ratio- 
nalitätsform für daten- statt theoriezentriertes Problemlösen nahe. (S. 14) 


Insbesondere mit Blick auf Self-Tracking diskutieren Sharon und Zandbergen 
(2016) den Vorwurf eines innerhalb der Quantified-Self-Bewegung vorherrschen- 
den Daten-Fetischismus, der von ihnen wie folgt charakterisiert wird: “The 
widespread idea that what draws self-trackers to numerical data is its perceived 
power of truth and objectivity” (S. 1695). Die besondere epistemische Qualität 
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von digitalen Daten und deren Bedeutung für Wissen sind im Umkehrschluss 
auch von wesentlicher Bedeutung für die Wahrnehmung von Big Data: Es kann 
am besten auf Grundlage digitaler Daten gewusst werden, so dass alles, was und 
worüber gewusst werden soll, in digitale Daten überführt werden muss. 

Mit dem Verwertungs- und Steuerungspotential von Daten verbunden ist also 
weiterhin die Erwartung an einen Nutzen, welcher sich, wie gezeigt, auf unter- 
schiedlichen Ebenen zwischen Individuum und Kollektiv manifestieren kann. 
Dabei ist der konkrete Nutzen zwar bereichsspezifisch jeweils völlig anders gear- 
tet, in seiner Valenz jedoch durchweg positiv. In Fragen der Mobilität ist ein 
Nutzen aus Datensammlung und -auswertung also anders gelagert als in der 
Medizin oder der Wirtschaft, jedoch ist er immer als Gewinn verstanden. Die 
positive Färbung ist, wie gezeigt, zum einen bedingt durch das Entstehen und 
die Förderung digitaler Datentechnik und IuK im wissenschaftlich-industriellen 
Komplex, welcher ein besonderes Interesse an der Hervorhebung ihrer Vorteile 
hat. Zum anderen wird sie jedoch auch allen Mitgliedern der Gesellschaft zuge- 
schrieben. Diesen attestiert Schirrmacher (2009) einen „Wahn, aus Angst vor 
Kontrollverlust die Welt in Formeln, Systematiken und Algorithmen, kurzum in 
Mathematik zu verwandeln. Wir werden immer unfähiger, mit Unsicherheiten 
und Unwahrscheinlichkeiten umzugehen (...)“ (S. 32). Als Ergebnis führen der 
Umgang mit dem Computer und die Auslagerung des Denkens und Entscheidens 
an die Digitaltechnik dazu, dass sich der menschliche Denkapparat verwandelt 
(Schirrmacher, 2009). Die gewichtige Konsequenz, die sich aus der Kombina- 
tion wahrgenommener Erkenntnis- und Nutzenpotentiale der Daten in der Folge 
ergibt: „Wir erleben gerade in Echtzeit, wie eine Gesellschaft unwiderruflich die 
Fundamente ihres Weltbildes ändert“ (Schirrmacher, 2009, S. 221). 

Für Nassehi (2019) hingegen verändert die fortschreitende Digitalisierung 
nicht eben jenes gesellschaftliche Fundament, sondern ist ein elementarer Teil 
dessen: Sie ist für ihn „nicht nur eine soziale Erscheinung (...), sondern sogar 
ein soziologisches Projekt“ (S. 18, Hervorh. im Orig.). So wie im Rahmen der 
Quantifizierung des Sozialen der empirische Ansatz des Messens zur sozialen 
Praxis wird, ist „vieles von dem, was die Digitalisierung betreibt, (...) von gera- 
dezu soziologischer Denkungsart: Sie nutzt soziale Strukturen, sie macht soziale 
Dynamiken sichtbar und sie erzeugt aus diesen Formen der Mustererkennung 
ihren Mehrwert“ (S. 18). Digitalisierung sei „unmittelbar verwandt (...) mit der 
gesellschaftlichen Struktur“ (S. 18, Hervorh. im Orig.). Die Möglichkeiten, Mus- 
ter und Strukturen mit Hilfe von Digitaltechnik sichtbar zu machen, fallen eben 
daher auf so fruchtbaren Boden, da sie bereits auf eine entsprechende Erwar- 
tungsstruktur der Gesellschaft treffen — diese ist mithin nicht Konsequenz, sondern 
Bedingung von Digitalisierung. 
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Ganz gleich, welche Vorbedingungen, Ursachen oder konkreten Änderungen 
des Denkens und Beobachtens in Zusammenhang mit Big Data diagnostiziert 
werden: In der Literatur wird eine aus der Wahrnehmung der Digitalisierung 
abgeleitete Erwartungshaltung immer schon unter dem Vorzeichen ihrer bereits 
manifesten, meist negativen Konsequenzen für Individuum und Gesellschaft dis- 
kutiert. Es wird mithin nicht nur vor den Risiken und Gefahren selbst gewarnt, 
die mit dem unhinterfragten Einsatz der Systeme einhergehen (Eubanks, 2018; 
Zuboff, 2019) und sich aus den negativen Konsequenzen der Quantifizierung 
für Individuum und Gesellschaft ergeben (Muller, 2019; O’Neil, 2017; Tufekci, 
2015). Es wird auch konkret vor einer kollektiven Mentalität gewarnt, die sich 
aus der stetigen Wiederholung der Ansprüche an datenbasiertes Wissen ergibt 
und die eine kritische Analyse und Reflexion der gesellschaftlichen Diffusion 
von Techniken der Quantifizierung verhindert oder zumindest erschwert (Mau, 
2017; Merry, 2016; Schirrmacher, 2009). Für einen Daten-Fetischismus gilt dann 
bspw.: “As it seeks to reduce all phenomena and means of accounting for pheno- 
mena to numbers, it simultaneously displaces other less easily quantifiable albeit 
insightful ways of expressing phenomena” (Sharon & Zandbergen, 2016, S. 1698, 
Hervorh. im Orig.). 


Kalkulative Praktiken im Rahmen einer technokratischen Steuerungslogik von 
Gesellschaft 
Die Wahrnehmung bezüglich der Potentiale von IuK für Wissen, Verstehen, 
Denken und hierauf begründeten Nutzen ist dort, wo sie angesprochen wird, 
also immer schon präsent. Diese Diagnose der Konsequenz kalkulativer Prak- 
tiken schließt dabei an eine lange Tradition von Beschreibungen und Warnungen 
bezüglich vermeintlich weit verbreiteter irrationaler Wahrnehmungsmuster tech- 
nokratischer gesellschaftlicher Steuerungslogik an, die sich bspw. bereits in den 
Arbeiten von Arendt (1972) und Roszak (1995) finden lassen. So kritisiert Arendt 
(1972) die Denkmuster der Entscheidungstragenden innerhalb des Pentagons im 
Zuge des Vietnamkrieges: “The problem-solvers did not judge; they calculated. 
(...) An utterly irrational confidence in the calculability of reality, becomes the 
leitmotif of the decision-making processes (...)” (S. 37-39, Hervorh. im Orig.). 
Roszak (1995) skizziert diese spezifische Logik einer von ihm analysierten 
technokratischen Gesellschaft demnach wie folgt: 


[A] society in which those who govern justify themselves by appeal to technical 
experts who, in turn, justify themselves by appeal to scientific forms of knowledge. 
And beyond the authority of science, there is no appeal. (...) Its assumptions about 
reality and its values become as unobtrusively pervasive as the air we breathe. (S. 7-8) 
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Auch hier steht der vermeintliche evidenzgetriebene Erkenntnisgewinn, das, 
was als scientific form of knowledge beschrieben wird, im Mittelpunkt gesell- 
schaftlicher Wahrnehmungsmuster und prägt eine Erwartungshaltung bezüglich 
der Entscheidungspraktiken innerhalb der eingangs beschriebenen Wissensgesell- 
schaft. Diese findet nun unter den Vorzeichen von Computertechnik und digitaler 
Daten verstärkt Widerhall. 

Weizenbaum (1976) thematisiert dieses technokratische Weltbild entsprechend 
früh mit Blick auf die aufkommende Computerisierung: “The introduction of 
computers into our already highly technological society has [...] merely reinfor- 
ced and amplified those antecedent pressures that have driven man to an ever 
more highly rationalistic view of his society and an ever more mechanistic image 
of himself” (S. 11). Er beschreibt dabei sein Erstaunen über die fehlende mensch- 
liche Einsicht zu reflektieren, zu welchem Denken eine Maschine den Menschen 
befähigt, der die Maschine zum Denken befähigt (vgl. auch Turkle, 1984). Die 
Konsequenz, den ein maschinenzentrierter Blick auf Vorstellungen der Denkpro- 
zesse von Mensch und Computer im Vergleich zu einem menschenzentrierten 
Blick hat, wird in der Folge von Norman (1993) herausgearbeitet: Während der 
menschenzentrierte Blick den Menschen bspw. als flexibel und veränderungsbe- 
reit versteht und den Computer als starr, spricht der maschinenzentrierte Blick 
dem Computer die Fähigkeit logischen und organisierten Denkens zu und dem 
Menschen ebenjene ab. 

Es muss festgestellt werden, dass die kritische Reflexion der Beziehung von 
Individuum und Gesellschaft zu Digitaltechnik und allen voran Computern mit 
Blick auf Vorstellungen und Denken über die Welt keineswegs neu ist. Dieser 
Kritik an einer technokratisch geprägten Wahrnehmung von Gesellschaft und 
Technik, der (Fehl-)Wahrnehmung der Potentiale und Differenzen menschlichen 
und computerisierten Denkens und in der Fortsetzung auch an der durch МК 
getriebenen Quantifizierung des Sozialen ist jedoch gemein, dass sie bereits 
immer auf das Vorhandensein dieser Wahrnehmungsmuster und hieraus resul- 
tierender Erwartungshaltungen im Sinne einer kollektiven Prädisposition abstellt, 
die je nach Betrachtung mit der Digitalisierung oder ihrer jeweiligen Artefakte 
und Phänomene verbunden ist. 

Auch die verheißungsvolle Erzählung der ubiquitären Verdatung mit ihren 
Möglichkeiten für computerisierte Formen des Denkens und Verstehens von Welt 
hat hier bereits immer schon gesellschaftliche Resonanz gefunden und mündet 
darauffolgend in entsprechend beeinflussten Einstellungen und Handlungen. Sie 
wird als Ergebnis eines kontinuierlichen und konsonanten gesellschaftlichen Dis- 
kurses vorausgesetzt, in dem Wirtschaft, Wissenschaft, Politik und Medien als 
dominante Sprecher auftreten. So resümiert Mau (2017): 
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Dass Daten zur Leitwährung des gesellschaftlichen Selbstbeobachtungs- und Selbst- 
beschreibungsgeschäfts geworden sind, ist allzu offensichtlich. Inwieweit sie andere 
Beschreibungs- und Beurteilungsformen des Sozialen nicht nur marginalisieren, son- 
dern vollständig zu verdrängen vermögen, ist bislang eine offene Frage. Mit der 
Durchsetzung der Quantifizierung werden wir aber — mehr oder weniger — zu Gläu- 
bigen in der Kirche der Zahlen. (S. 47) 


Diese deterministisch anmutende Sichtweise, bei der eine eingangs skizzierte 
Wahrnehmung der Quantifizierung des Sozialen zu einer entsprechenden Erwar- 
tungshaltung führt, greift meiner Ansicht nach zu kurz. Erst muss der Versuch 
unternommen werden, etwas über das Vorhandensein entsprechender Annahmen 
und Erwartungen — oder das, was Mau auch als einen Glauben bezeichnet — 
zu erfahren. Es muss also zunächst die tatsächliche Struktur und Ausprägung 
der Überzeugungen bezüglich der gewonnenen Erkenntnis und des Nutzens aus 
der Quantifizierung analysiert werden, bevor das Vorhandensein einer kollektiven 
Mentalität faktisch angenommen und etwaige Auswirkungen dieser untersucht 
werden können. 
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In diesem Abschnitt wird nun mit Bezug auf die vorhergehenden Aus- 
führungen zu Big Data argumentiert, dass sich das soeben beschriebene 
Wahrnehmungsmuster als ein Glaubenssystem beschreiben lässt: das Big-Data- 
Glaubenssystem (BDGS), das sich in seinen Glaubensüberzeugen insbesondere 
auf den Erkenntnis- und Nutzengewinn durch Big Data bezieht. Denn an dieser 
Stelle kommen die zuvor in den einzelnen Kapiteln gespannten konzeptuellen 
Faden sozio-technischer Betrachtung des Phänomens Big Data zusammen und 
bereiten gleichzeitig ein genaueres Verständnis durch kognitions-psychologische 
Messung vor. Es muss daher zunächst die Bedeutung der zuvor beleuchteten 
Überlegungen für eine nachfolgende Analyse verdeutlicht werden. 

Anhand der in Kapitel 3 eingeführten Beschreibungsdimensionen von Big 
Data können die zentralen Wesenszüge eines solchen Glaubenssystems nach- 
folgend erörtert werden. In diesem Zusammenhang musste als Vorbereitung 
einer Überzeugungshaltung zunächst auch thematisiert werden, dass die zuvor 
besprochenen sozio-technischen Dimensionen nicht als stabile Wesensmerkmale 
digitaler Daten zu verstehen sind, die immer und überall auf diese zutreffen. 
Ihre Ausprägung bewegt sich mithin auf einem qualitativen Kontinuum. Das 
sollte zwar auch für Überzeugungen gelten, die sich aus den eher deskriptiven 
und weitgehend übereinstimmend angenommenen Charakteristika von Big Data 
wie deren Ausmaß, die Geschwindigkeit der Datenentstehung und -verarbeitung 
und ihre Vielfalt ergeben. Es sind jedoch vor allem die Überzeugungen bezüg- 
lich der eher konsequentiell-evaluativen Dimensionen des Erkenntnis- und des 
Nutzengewinns durch digitale Daten, die in Betracht gezogen werden müssen 
und ihrer Voraussetzung nach eine besondere Ambivalenz zulassen. Dabei ist 
in Kapitel 4 dann veranschaulicht worden, wie und weshalb Daten ihre Bedeu- 
tung hier vor allem als Grundlage von Wissen und Wissenserwartungen erlangen. 
Denn es ist insbesondere die Möglichkeit, durch Daten vermeintlich wahrhaftig 
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und wirklichkeitsabbildend Zustände der Welt festzuhalten, die dann Unterschei- 
dungen zulassen und somit Wissen über die Welt bereitstellen. Erkenntnisse aus 
hieraus ermöglichten Vergleichen zwischen unterschiedlichen Entitäten auch über 
die Zeit hinweg nähren das Wissen, das als konstitutiv für heutige Gesellschaf- 
ten angenommen wird. Die Ausführungen über die gesellschaftliche Verbreitung 
und Bedeutung von Vergleichen unter Voraussetzungen von IuK und digitalen 
Daten haben daher in Kapitel 5 gezeigt, dass auch in diesem Rahmen Prozesse 
der Erkenntnisgenerierung Gegenstand von menschlicher Wahrnehmung des Phä- 
nomens Big Data sind, wobei insbesondere Erwartungen an den Nutzen aus der 
Quantifizierung des Sozialen in den Blick gerieten. 

Mit Blick auf die Vorstellungen der Bevölkerung, die mit digitalen Daten 
und der Quantifizierung des Sozialen einhergehen, wurde, wie im vorher- 
gehenden Kapitel dokumentiert, in der Literatur ein ausgeprägtes kollektives 
Wahrnehmungsmuster bezüglich digitaler Daten vermutet. Es kann hier davon 
ausgegangen werden, dass es vor allem weit verbreitete gesellschaftliche, insbe- 
sondere medial vermittelte Erzählungen sind, durch die die meisten Menschen 
etwas über gesellschaftliche Mythen wie etwa Big Data oder die Wissensgesell- 
schaft erfahren (Kübler, 2009; Rössler & Krotz, 2005). Es ergibt sich dann aus 
der öffentlichen Thematisierung der digitalen Daten und diesbezüglicher Ereig- 
nisse und Phänomene im Rahmen kommunikativer Vermittlung eine womöglich 
durchaus individuell unterschiedlich geartete Überzeugungsleistung. Die in der 
dominanten Erzählung zu Big Data vorkommenden Beschreibungen, Mythen 
und Metaphern werden weiterhin vor dem Hintergrund individueller persönlicher 
Erfahrungen bewertet und ggf. angepasst oder gar revidiert. Diese Erwartungen 
an die Qualität und Wirkmächtigkeit der digitalen Daten, insbesondere vor dem 
Hintergrund des weitgehend indirekten und mittelbaren individuellen Zugangs zu 
diesen, können für zusätzliche Variabilität persönlicher Einschätzungen sorgen. 
Diese Einschätzungen bezüglich eines Erkenntnis- und Nutzengewinns sind dabei 
nicht nur bedingt durch die Unsicherheit der Qualität von digitalen Daten, sondern 
aufgrund der Unsicherheit von Zukunftserwartungen bezüglich der Konsequenzen 
der Datenverwertung kontingent. Der Grad der Überzeugung von Propositionen 
ist, wie in Abschnitt 4.1.2, ein zentrales Kriterium von Wissen und unterschei- 
det sich hier, wie auch nachfolgend gezeigt wird, von Glauben. Es ist mithin 
diese vermeintliche Variabilität, die auch in den nachfolgenden Merkmalen eines 
Glaubens zum Ausdruck kommen muss. 

Zunächst wird hierfür ausgeführt, was unter einem Glaubenssystem verstan- 
den werden kann und wie es sich von Wissenssystemen unterscheidet, um 
anschließend anhand der Beschreibungsdimensionen den Glauben an Big Data zu 
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skizzieren. Die Frage nach der tatsächlichen Ausprägung und den Konsequenzen 
dieses BDGS kann anschließend empirisch analysiert und beantwortet werden. 


6.1 Glaube im Verhältnis und Abgrenzung von 
anderweitigen Konzepten menschlicher 
Wahrnehmung 


Beschreibungen von kollektiven Vorstellungen von sozialer Wirklichkeit haben 
eine lange Tradition in den Sozialwissenschaften. Auch mit Blick auf das 
Verständnis der menschlichen Deutung der Konsequenzen digitaler Daten für 
Gesellschaft bieten sich etliche Erklärungsansätze für menschliche oder gar 
gesellschaftliche Erzählungen an. So wird oft von Frames (Matthes, 2014) und 
von Narrativen (Müller-Funk, 2008; Mumby, 1993) gesprochen. Psychologen 
beziehen sich bei der Untersuchung kognitiver menschlicher Vorstellungen von 
der Realität auch auf mentale Modelle (‚Mental Models‘): “(...) People’s views of 
the world, of themselves, of their own capabilities, and of the tasks that they are 
asked to perform, or topics they are asked to learn, depend heavily on the concep- 
tualizations that they bring to the task” (Norman, 1983, S. 7). Auch wenn diese 
Konzeptionen vielfach anschlussfähig an einen zu erörternden Glauben sind: Es 
ist gerade die Möglichkeit individueller Zweifel und Unsicherheiten in Abgren- 
zung von bestehendem Wissen sowie die diesbezüglich graduelle Überzeugung 
von unterschiedlichen Qualitäten und Eigenschaften der digitalen Daten, die dem 
Glaubensbegriff im Kontrast zur Rolle des Wissens seine besondere Passgenau- 
igkeit und Relevanz verleihen. Es geht der vorliegenden Arbeit im Nachgang 
insbesondere auch darum, vor dem Hintergrund einer bereits vielfach skizzierten 
und kritisierten Vorstellung von Digitalisierung und Gesellschaft, den variablen 
Grad zugrunde liegender Überzeugungen bezüglich digitaler Daten sichtbar zu 
machen und in seiner Wirkung zu analysieren. 

Vor dem Hintergrund der Nicht-Nachprüfbarkeit der faktischen Voraussetzun- 
gen sowie Tatsachen von digitalen Datenbeständen sowie der Nicht-Einsehbarkeit 
der Zusammenhänge zwischen seinen diffusen Konstrukten, der (Un-)Sicherheit 
getroffener Aussagen und der Abwesenheit theoretischer und empirischer Rigoro- 
sität soll anders als bei J. Hofmann (1993) auch nicht mit dem Begriff impliziter 
Theorien gearbeitet werden. Denn die dort analysierten Deutungsentwürfe werden 
als bereits bestehende recht klar umrissene Theoriegebäude politischer Diskurse 
oder Programme und daher als bestehendes „Ensemble von axiomatischen, kau- 
sal verknüpften Aussagen über soziale Wirklichkeit“ (J. Hofmann, 1993, S. 13) 
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untersucht, die erklärend für akteurszentrierte Handlungspraktiken herangezo- 
gen werden. Dieser Bestimmtheit entzieht sich einer als Glauben beschriebenen 
Erwartungshaltung im Rahmen des BDGS trotz feststehender Bezugspunkte 
aufgrund der Möglichkeit unterschiedlicher Zusammenhänge der Glaubensdimen- 
sionen untereinander. So kann man glauben, dass die digitalen Daten eher nicht 
objektiv sind, sich dennoch Wissen auf Grundlage der Daten generieren lässt, die 
Gesellschaft jedoch insgesamt eher nicht von ihnen profitiert, man selbst jedoch 
ganz sicher einen Nutzen aus ihnen zieht und vice versa. 

Am ehesten ließe sich in Zusammenhang mit dem Glauben an digitale 
Daten noch auf ein Vertrauen Bezug nehmen. So hat die sozialwissenschaftli- 
che Forschung in den letzten Jahren vor allem auf Vertrauen als einstellungs- 
und handlungsrelevantes Phänomen für die Bedeutung von Digitaltechnologie 
abgestellt. Hierbei gerieten mit Blick auf die Nutzung digitaler Medien die kom- 
munikativen Mechanismen für das Entstehen oder den Verlust von Vertrauen in 
den Fokus (Mesch, 2012; Nundy et al., 2019; Taddei & Contena, 2013; Yagoda & 
Gillan, 2012). Ein Datatrust, wie ihn Rieder und Simon (2016) formulieren, 
bezieht sich dabei dann jedoch nicht auf die Vorstellungen von Daten und hieraus 
abgeleiteten Erwartungen selbst, sondern auf die diesbezüglichen Handlungen 
derjenigen Akteur*innen, die am Entstehungs- und Verwertungskontext maßgeb- 
lich beteiligt sind und denen man vertrauen kann. Selbst wenn der Glaube einen 
Einfluss auf Vertrauen haben könnte, ist es hier im vorliegenden Fall jedoch nicht 
die Sicht der Bevölkerung auf eben diese Akteur*innen, die in den Blick gerät. 
Vielmehr ist es ihre unmittelbare Beziehung zu den großen digitalen Datenbestän- 
den. Dieses Verhältnis der Bürger*innen zu den Big Data soll nun nachfolgend 
untersucht werden. 

Glaube ist in diesem Zusammenhang nicht als religiöser Glaube zu verste- 
hen und insbesondere auch nicht als blinder Glauben. Sondern er lässt sich 
mit Blick auf das Phänomen, auf das er sich bezieht und das im vorliegen- 
den Fall das Wesen und die Konsequenzen von Big Data sind, von Wissen 
und Wissenssystemen abgrenzen. Es handelt sich vor dem Hintergrund der 
in Abschnitt 4.1 ausgeführten Bedingungen von Wissen vielmehr um eine in 
wesentlichen Elementen von diesem Wissen verschiedene subjektive Überzeu- 
gungshaltung, deren Wahrheitsanspruch umstritten bzw. situativ zu bewerten ist 
und daher relational variabel aus Sicht der Gläubigen eingeordnet werden kann. 
Für deren Glaubenssystem werden bei Abelson (1979) nicht nur Merkmale an 
die Hand gegeben, anhand derer sich die Bezugspunkte zwischen individueller 
Wahrnehmung, bestehender Ungewissheit und Erwartung an digitale Daten mit 
denen eines Glaubens aufzeigen lassen (siehe Abschnitt 6.2.1). Er fokussiert auch 
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auf die kommunikativen Mechanismen ihrer Vermittlung und Erwartungsformung 
(siehe Abschnitt 6.2.2). 


6.2 Der Unterschied zwischen Glaubens- und 
Wissenssystemen 


Abelson (1979) unterscheidet nun hinsichtlich der Forschung zu KI- 
Anwendungen Glaubenssysteme (Belief Systems) von Wissenssystemen (Know- 
ledge Systems).! Letztere zeichnen sich durch gesichertes Wissen über Fakten 
und Zusammenhänge aus, die weitgehend allgemein als Tatsachen anerkannt wer- 
den. Es stellt bspw. niemand in Frage, dass ein Ball gravitationsbedingt eine 
Schräge herunterrollen wird. Aus erkenntnistheoretischer Perspektive haben Wis- 
senssysteme daher auch einen unmittelbar prognostischen Charakter: Wenn etwas 
tatsächlich gesichertes Wissen ist, dann sollten sich anhand der wahren Aussagen 
eines Systems mit relativer Sicherheit eintretende Vorhersagen machen lassen. 
Ein Glaubenssystem unterscheidet sich hiervon in der Nicht-Nachprüfbarkeit der 
faktischen Voraussetzungen sowie realiteren Zusammenhänge zwischen seinen dif- 
fusen Konstrukten, der (Un-)Sicherheit getroffener Aussagen und der Abwesenheit 
theoretischer und empirischer Rigorosität (Abelson, 1979). Abelson konkreti- 
siert weiterhin verschiedene Merkmale eines Glaubenssystems, anhand derer 
sich Unterschiede zwischen den beiden Systemtypen festmachen lassen — auch 
wenn es durchaus etliche Gemeinsamkeiten und Graubereiche zwischen ihnen 
geben kann. Im Folgenden werden diese Unterschiede anhand der Erwartungen 
und Ansprüche an Big Data und ihrer Diskussion in der Literatur besprochen 
und somit direkt auf einen Glauben an Big Data bezogen. Dabei werden zum 
einen die drei zentralen Merkmale, die auf die Qualität gemachter Aussagen von 
Glaubenssystemen abzielen, diskutiert (siehe Abschnitt 6.2.1) und zum ande- 
ren kommunikative Merkmale des diesbezüglichen Diskurses im Rahmen von 
Glaubenssystemen angesprochen (siehe Abschnitt 6.2.2). 

Es ist hierbei wichtig zu berücksichtigen, dass die von Abelson beschriebenen 
Differenzierungen in unterschiedlicher Ausprägung vorhanden sein können und 
wie von ihm vermerkt jedwedes Merkmal weder notwendig noch hinreichend 
für die Identifikation von Glaubenssystemen vorhanden sein muss. Allerdings, so 
stellt Abelson fest (1979): “Any system embodying most of them, however, will 


! Dabei geht es bei Abelson (1979) nicht um einen Glauben an die KI selbst, sondern um die 
Möglichkeit der Repräsentation und Verarbeitung von Glaubenssystemen durch КТ. Vor die- 
sem Hintergrund skizziert er die Merkmale und Eigenschaften von Glaubens- im Unterschied 
zu Wissenssystemen, ohne die KI zum Gegenstand selbiger zu machen. 
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have the essential character of a ‘belief system’” (S. 356). Dabei sind die eher 
deskriptiven Dimensionen von Big Data wie Volumen, Geschwindigkeit und Viel- 
falt wie dokumentiert weitgehend unstrittige definitorische Elemente. Es lassen 
sich daher vor allem die als konsequentiell-evaluativ charakterisierten Dimensio- 
nen als Bezugspunkte eines BDGS verstehen, da sich mit ihnen interpretative und 
faktisch nicht gesicherte Annahmen bezüglich der Richtigkeit der Daten sowie 
eines Erkenntnis- und Nutzengewinns verknüpfen. Es ist zu zeigen, dass obwohl 
definitorische Aussagen über Big Data getroffen werden, diese nicht in allen 
Fällen uneingeschränkt haltbar sind und somit kein allgemeines und gesicher- 
tes Wissen über und durch Big Data besteht, sondern ganz im Gegenteil viele 
mit Unsicherheit behaftete Hoffnungen und Erwartungen mit der Sammlung und 
Verwertung großer digitaler Datenbestände verbunden sind. Es ist also davon 
auszugehen, dass sich mit dem Wesen von Big Data verknüpfte Vorstellungen 
insbesondere an den genannten Bezugspunkten orientieren und eine grundsätzli- 
che Existenz des Phänomens sowie seine Beschreibbarkeit nicht per se in Frage 
gestellt werden. Es geht weiterhin auch nicht um Aussagen, die mit Hilfe oder 
auf Grundlage großer digitaler Datenbestände getroffen werden, sondern um Pro- 
positionen über Wesen, Qualität und Konsequenzen von Big Data, die variabel 
sein können. Die Variabilität dieser Aussagen soll nachfolgend erörtert werden. 


6.2.1 Dissens, Bewertungsunterschiede und Ungewissheit als 
Merkmale der Annahmen eines BDGS 


In diesem Abschnitt soll daher zunächst auf drei zentrale Merkmale von Glau- 
benssystemen nach Abelson (1979) eingegangen werden, die die im Rahmen 
eines Glaubens an digitale Daten getroffenen Propositionen betreffen: (1) Dis- 
sens, (2) Unterschiede der Bewertung sowie (3) Ungewissheit. Dabei bedingen 
und beeinflussen sich die Merkmale gegenseitig. Es wird daher zunächst auf den 
Dissens eingegangen, um nachfolgend zu verdeutlichen, wovon dieser maßgeblich 
abhängt. Das Potential für Dissens betrifft die zentralen Elemente von Glaubens- 
systemen: “The elements (concepts, propositions, rules, etc.) of a belief system 
are not consensual” (Abelson, 1979, S. 356, Hervorh. im Orig.). In den vorange- 
gangenen Kapiteln zum Wesen von Big Data ist dabei deutlich geworden, dass 
mit Blick auf deren Beschreibungsdimensionen in der Literatur zwar große Über- 
einstimmung darüber besteht, dass die anfallenden Datenmengen sehr groß sind 
und es spezieller Speicher- und Auswertungstechniken benötigt, um mit diesen 
Daten zu arbeiten. Auch über die Geschwindigkeit, mit der die Daten entstehen 
und dann am besten auch gleich ausgewertet werden, besteht Konsens und es 


6.2 Der Unterschied zwischen Glaubens- und Wissenssystemen 85 


gibt keine Hinweise darauf, dass ein Laienverständnis hiervon abweichen könnte. 
In Anbetracht der weitreichenden Durchdringung aller Lebensbereiche durch die 
Digitalisierung und mit ihr aufkommender Phänomene wie Industrie 4.0 und dem 
ТоТ wird nicht nur die Allgegenwärtigkeit von Daten im privaten und beruflichen 
Alltag deutlich, sondern auch die Stetigkeit ihrer Entstehung und Auswertung 
sowie die hierfür notwendige Dauerhaftigkeit ihrer Speicherung. 

Es sind mithin weniger die konzeptionellen Elemente (sprich: die Beschrei- 
bungsdimensionen an sich) von Big Data selbst, über die Dissens bestehen 
kann. Im BDGS sind es die bezüglich der digitalen Datenbestände getroffe- 
nen Aussagen, die die Ausprägungen der einzelnen Dimensionen sowie deren 
Zusammenhänge und Mechanismen betreffen, die strittig sind. 

Doch woher genau rührt dann ein vermeintlicher Dissens? Trotz konzeptueller 
Übereinstimmung zeigt sich mangelnde Konsensualität vor allem in Verbindung 
mit einem weiteren Merkmal des Glaubenssystems: “Belief systems rely heavily 
on evaluative and affective components” (Abelson, 1979, S. 358, Hervorh. im 
Orig.). Denn es sind erst diese Bewertungsunterschiede, die den Dissens offen- 
baren. Während nämlich die Sammlung und Auswertung der großen digitalen 
Datenbestände für die einen begründete Hoffnung ist, ist sie für andere eine 
Dystopie, bei der die Grenzen von Anstand und Privatheit überschritten werden. 
Wie aufgezeigt, gibt es durchaus etliche Warnungen bezüglich des Ausmaßes 
der Datensammlung und -verwertung in der Literatur, die dann gleichzeitig eine 
gegenteilige Auffassung bezüglich vermeintlicher Chancen und Risiken in der 
breiten Bevölkerung postulieren (siehe Abschnitt 5.4). Es soll hierbei nicht die 
Behauptung aufgestellt werden, dass die vermeintliche herrschende wissenschaft- 
liche Einschätzung generell konträr zur Bevölkerungsmeinung verläuft. Es zeigt 
sich hier jedoch die Möglichkeit fundamentaler Bewertungsunterschiede bezüg- 
lich der Moralität der Sammlung und Verwertung von Big Data. Folglich gilt: “A 
belief system typically has large categories of concepts defined in one way or ano- 
ther as themselves ‘good’ or ‘bad’, or as leading to good or bad” (Abelson, 1979, 
S. 358). Auch wenn nicht zu erwarten ist, dass in absehbarer Zukunft Kame- 
ras, Eingabegeräte und Sensoren alle menschlichen Lebensbereiche vollständig 
durchdrungen haben, so laufen fortwährend gesellschaftliche Diskussionen, an 
welchen Orten und in welchen Situationen die digitale Erfassung und Speiche- 
rung von Zuständen und menschlichen Handlungen zulässig ist (Barnard-Wills, 
2011; Zuboff, 2019). Ob flächendeckende (Gesichts-)Erfassung an öffentlichen 
Orten oder ein Chip in Haushaltsgeräten, in Kleidung oder gar unter der Haut: 
Es wird meist nicht darüber diskutiert, ob es (schon) möglich ist, Entitäten zu 
erfassen und in Daten zu überführen, sondern diskutiert, ob es ge- oder verboten 
sein sollte, dies zu tun. 
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Die unterschiedlichen Überzeugungen von der Notwendigkeit der Samm- 
lung und Auswertung sowie der hiermit verbundenen Wirkmächtigkeit von Big 
Data, die sich aus den unterschiedlichen Bewertungen speisen und über die Dis- 
sens bestehen kann, können also weiterhin mit etwaiger gradueller Ungewissheit 
behaftet sein. Eigenschaften, Zweck sowie Nutzen sind somit nur relational, folg- 
lich subjektiv und immer situativ zu bewerten. Sie können nicht mit Absolutheit 
festgestellt werden und sind bezüglich zukünftiger Entwicklungen mit Erwar- 
tungsunsicherheit behaftet. Etwaige Überzeugungen grenzen sich somit von einer 
Gewissheit ab (Abelson, 1979), die als Bedingung von Wissen mit hoher Konfi- 
denz bezüglich der tatsächlichen Auswirkungen von Big Data belegt sein sollte 
(siehe Abschnitt 4.1.2). 


Erwartungen bezüglich der Richtigkeit von digitalen Daten als Bezugspunkt eines 
Glaubens an Big Data 
Mit Blick auf das Wissen, das aus den Daten gewonnen werden soll, sowie 
die Genauigkeit und Objektivität dessen, was die Daten abbilden, lassen sich 
hinsichtlich des Glaubens an die großen digitalen Datenbestände Dissens, Bewer- 
tungsunterschiede und Ungewissheit beobachten. All jene Aspekte, die der 
Beschreibungsdimension der Richtigkeit zugerechnet werden können, wurden wie 
ausgeführt in der Literatur durchaus kritisch besprochen. So gehen u. a. boyd und 
Crawford (2012) in ihren Thesen zu Big Data auf die weitläufige Behauptung ein, 
Big Data seien objektiv und würden die Wirklichkeit genau abbilden, und hinter- 
fragen diese. Sie widersprechen hierbei Erwartungen, eine Wissenschaft, die sich 
Big Data bedient, arbeite anders als sonst nun mit Daten, die reliabel erhoben sind 
und die Wirklichkeit detailgetreu und wahrhaftig abbilden. Jegliche Arbeit mit 
Daten ist laut Ansicht der Autorinnen ein interpretativer Prozess. Es gibt streng 
genommen keine Rohdaten, da die Entscheidung über die Art und Weise der Spei- 
cherung bereits subjektiv menschlich beeinflusst ist. Raw data is an oxymoron (so 
der plakative Titel eines Sammelbands von Gitelman, 2013). Angefangen damit, 
dass subjektive Entscheidungen getroffen werden, zu welchen Variablen Daten 
erhoben werden, wie diese erhoben werden, welche Variablen ausgewertet und 
welche nicht ausgewertet werden, wird auch darauf hingewiesen, dass die großen 
Datensätze fehleranfällig sind und hierdurch nicht zwangsläufig ein zuverlässiges 
und wahres Abbild der Realität wiedergeben (siehe Abschnitt 3.5.1). So kommt 
es durch Fehler und Ausfälle bei der Datenerhebung mitunter zu Verzerrungen, 
die im Falle der Fusion mit anderweitigen Datensätzen vergrößert werden können. 
Probleme mit Blick auf die Wahrhaftigkeit der Daten haben dann auch einen 
Einfluss auf das Wissen, das aus den Daten generiert werden kann. Wenn 
die Daten die Wirklichkeit fehlerhaft abbilden — und diese Gefahr besteht wie 
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beschrieben durchaus —, dann bedeutet das in der Konsequenz auch, dass Wis- 
sensbestände, die auf Big-Data-Analysen basieren, Fehler aufweisen können und 
im schlimmsten Fall nicht wahrheitsgetreu sind. Zur Fehlerproblematik kommt 
zudem noch das Problem ökologischer Fehlschlüsse hinzu. Getreu des Dik- 
tums aus der Statistik, dass von Korrelationsbeziehungen nicht auch automatisch 
auf Kausalitätsbeziehungen zu schließen ist, sind Analysen von Big Data, die 
nicht theoriebasiert, sondern nur auf der Grundlage von Korrelationsbeziehun- 
gen argumentieren, auch im Hinblick auf das entstehende Wissen fehleranfällig. 
Für eine betriebswirtschaftliche Forschung, die nur darauf aus ist, auf Grundlage 
der aus den Daten gezogenen Erkenntnisse wirtschaftlichen Profit zu generie- 
ren, mögen solche Ergebnisse meist ‚gut genug‘ sein (C. Anderson, 2008). Sollte 
sich diese Perspektive allerdings durch viele andere wissenschaftliche Disziplinen 
verbreiten und Anerkennung finden, wäre dies als Rückschritt zu betrachten mit 
teils negativen Konsequenzen (Bowker, 2014). Aufgrund der skizzierten Unsi- 
cherheit bezüglich der Richtigkeit und Wahrhaftigkeit der digitalen Daten und 
eines sich hieraus ergebenden Erkenntnisgewinns kann man zwar dennoch davon 
überzeugt sein, dass sich auf Datengrundlage ein großer Wissensschatz heben 
lässt. Allerdings kann man auch anderer Ansicht sein, gegenteilige Überzeugun- 
gen hegen oder zumindest etwaige gewichtige Einschränkungen anmerken. Der 
Überzeugungsgrad ist daher intersubjektiv variabel. 


Nutzenerwartungen als Bezugspunkt eines Glaubens an Big Data 

Es stellen sich im Rahmen der Datensammlung und -auswertung nunmehr vor 
allem auch ethische Fragen des Zusammenlebens vor dem Hintergrund der tech- 
nischen Möglichkeiten der Digitalisierung (Crawford et al., 2014; Filipovic, 2015; 
Qiu, 2015; Richterich, 2018). In dieser Diskussion werden die Merkmale des 
Dissens, der Überzeugung und der Ungewissheit des Glaubenssystems besonders 
deutlich hervorgehoben. Kein Konsens besteht mithin darüber, in welchen Situa- 
tionen des Lebens Daten entstehen und ausgewertet werden sollen und dürfen. In 
der Diskussion ethischer Fragen, wie auch in der mit ihr oftmals einhergehenden 
allgemeinen Kosten-Nutzen-Abwägung, zeigt sich die unterschiedliche Bewer- 
tungseinschätzung und mithin ein Dissens hinsichtlich eines individuellen und 
gesellschaftlichen Nutzens, der realisiert werden kann, sich jedoch erst einmal tat- 
sächlich realisieren muss. Diese Nutzenbewertung kann zudem auch hinsichtlich 
individueller und gesellschaftlicher Bewertung auseinanderfallen und ist mithin 
variabel: Profitiert das Selbst, kann der erwartete Nutzen für die Gesellschaft 
dennoch geringfügig ausfallen und umgekehrt. Vor allem vor dem Hintergrund 
der konsequentiell-evaluativen Dimensionen offenbart sich also der mit Big Data 
verbundene Glaube. Man kann zwar vom individuellen und gesellschaftlichen 
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Nutzen durch digitale Daten überzeugt sein. Diese Überzeugung ist jedoch wie 
erörtert eher ein Glaube als ein Wissen, da sie in Abhängigkeit der zuvor erör- 
terten Tragweite ihrer Rechtfertigung eine weitgehend in die Zukunft gerichtete 
Erwartung ist, die durchaus intersubjektiv variabel ausfallen kann und erfüllt wird. 

Wenngleich die Diskussion um Wahrhaftigkeit, Wissensgewinn und hieraus 
entstehenden Nutzen von und durch Big Data an dieser Stelle nicht abschlie- 
Bend geklärt werden soll, so ist deutlich geworden, dass insbesondere mit Blick 
auf die soeben erwähnten Dimensionen (1) kein Konsens bezüglich der genann- 
ten Ausprägungen der sozio-technischen Beschreibungsdimensionen besteht und 
aufgrund der vielfältigen Entstehungskontexte und Verwendungszusammenhänge 
der Daten auch nicht bestehen kann, so dass (2) getroffene Aussagen deshalb 
mit wesentlicher Unsicherheit behaftet sind und mithin (3) eine starke evaluative 
und affektiv aufgeladene Auseinandersetzung mit der Sammlung und Verwer- 
tung von Big Data im Rahmen des BDGS besteht. Die Überzeugung, dass auf 
der Grundlage dieser digitalen Daten Erkenntnis- und Nutzengewinne realisiert 
werden können, sieht sich etwaigen Zweifeln ausgesetzt, kann folglich durchaus 
unterschiedlich ausfallen und verweist somit auf einen diesbezüglichen Glauben, 
den man mehr oder weniger haben kann oder auch nicht. 


6.2.2 Weiterführende diskursive Merkmale eines 
Big-Data-Glaubenssystems 


Es gibt zudem noch einige weitere Merkmale von Glaubenssystemen, die von 
Abelson beschrieben werden und Erwähnung finden sollen: Sie betreffen dabei 
keine Qualitäten der im Rahmen des Glaubenssystems getroffenen Aussagen, son- 
dern stellen auf zusätzliche kommunikative diskursive Merkmale und Elemente 
ab, die dem Glauben zuträglich sind und die sich auch mit Blick auf Big Data 
veranschaulichen lassen. Hier äußert sich dann auch die besondere Anschlussfä- 
higkeit zu untersuchender Glaubenssysteme an die kommunikationswissenschaft- 
liche Forschung und insbesondere an die Ideen der Kultivierungsforschung, da 
davon ausgegangen wird, dass die nachfolgenden diskursiven Merkmale in einem 
langfristigen Prozess stetig wiederholt aufgegriffen werden (Gerbner et al., 1980; 
Gerbner, 1998). 

Zu Glaubenssystemen gehört dabei eine generelle Offenheit und Anschlussfä- 
higkeit für weiterführende konzeptuelle Entitäten sowie eine schwerpunktmäßige 
Beschäftigung mit der (Nicht-)Existenz einzelner Phänomene, auf die sich der 
Glaube bezieht (Abelson, 1979). Wie schon hinsichtlich der Vielzahl an Beschrei- 
bungsdimension mit dem Buchstaben V deutlich wurde (siehe Abschnitt 3.3), 
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eignet sich Big Data auch in dieser Hinsicht als Projektionsfläche ausufernder 
Erwartungen, die allesamt anschlussfähig sind, sofern sich nur eine Erzählung 
findet, die dieser Bezeichnungskonvention folgt oder auf die gleichen Bezugs- 
punkte wie etwa das aus Daten gewonnene Wissen und den hieraus gezogenen 
Nutzen Bezug nimmt (Shafer, 2017). Nicht nur über Zugehörigkeit zum Phäno- 
men Big Data kann debattiert werden, sondern insbesondere über ihre Bedeutung 
und Konsequenz für Gesellschaft. Hier wurde wie in Abschnitt 3.6 auf Erwar- 
tungen an datenbasierte Anwendungen wie Machine Learning hingewiesen sowie 
auch die direkte Verbindung zu anderweitigen verwandten Erwartungshaltungen 
innerhalb der Gesellschaft hergestellt, wie mit Blick auf die Ausführungen zur 
Wissensgesellschaft in Abschnitt 4.2 hergeleitet wurde. 

Zudem wird auch die kommunikative Bedeutung episodischer Erzählun- 
gen aufgegriffen: “Belief systems are likely to include a substantial amount of 
episodic material from either personal experience or (for cultural belief sys- 
tems) from folklore or (for political doctrines) from propaganda” (Abelson, 
1979, S. 358, Hervorh. im Orig.). Wer die (populär-Jwissenschaftliche Lite- 
ratur zu Big Data verfolgt, der stolpert bei der Lektüre immer wieder über 
(die gleichen) Geschichten aus unterschiedlichen Anwendungskontexten. Um den 
Leser*innen das abstrakte Themengebiet nahezubringen, wird bspw. häufig auf 
Google-Suchanfragen verwiesen, die täglich von Millionen von Menschen aus- 
geführt werden und aus denen sich Erkenntnis und Nutzen ziehen lässt (siehe 
u. a. bei Harford, 2014; D. Lazer et al., 2014; Mayer-Schönberger & Cukier, 
2013; Stephens-Davidowitz, 2017). Auf Grundlage von Nutzersuchen zu Krank- 
heitssymptomen gelang es Forschenden von Google z. B., Vorhersagen zur 
Krankheitsausbreitung der Grippe in den USA zu treffen. Die ‚Google Flu Trends‘ 
sind ein spezieller, jedoch eingängiger Fall, an dem sich die vermeintlichen 
Wesensmerkmale von Big Data und insbesondere der Erfolg und Nutzen deutlich 
machen lassen. Es ist diese Einbettung in episodische Zusammenhänge, die die 
Bedeutung und Wirkmächtigkeit von Big Data verbildlichen soll, die von Pusch- 
mann und Burgess (2014) auch als Metaphern von Big Data analysiert wird. So 
sind, wie zuvor erwähnt, in den vergangenen Jahren unzählige Bücher erschie- 
nen, die voll von Anekdoten und Vergleichen sind, die dem Phänomen Big Data 
Nachdruck verleihen und anhand einzelner Use Cases von den Vor- und Nachtei- 
len überzeugen sollen. Dieses episodische Material eines Glaubenssystems nach 
Abelson findet sich in den metaphorischen Teilen eines öffentlichen Diskurses 
zu Big Data, dessen Erzählungen durch stete Wiederholung zur öffentlichen 
Wahrnehmung beitragen. 

Dieser episodische Zugang im Diskurs von Big Data formt dann entsprechende 
Erwartungen, die formuliert werden. „Wenn bald mein Kühlschrank weiß, was ich 
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einkaufen soll, dann kann mir mein Arzt doch wohl sagen, wie ich schnellstmöglich 
wieder gesundwerde.“ Dies befeuert einen diesbezüglichen Glauben womöglich 
dahingehend, als dass mit Blick auf die Zukunft einer Welt unter den Vorzeichen 
von Big Data Vorstellungen evoziert werden, die normativen Ansprüchen folgen, 
wie diese Zukunft und auch der Weg dorthin auszusehen haben. “Belief systems 
often include representations of ‘alternative worlds’, typically the world as it is and 
the world as it should be” (Abelson, 1979, S. 357, Hervorh. im Orig.). Es wird 
dann recht ausführlich skizziert, wie bspw. medizinische Big-Data-Anwendungen 
einen Wandel hin zu einer insgesamt besseren Gesundheitsversorgung bewir- 
ken und Menschen gesünder werden lassen, ungeachtet weiterhin wirksamer 
gesellschaftlicher Rahmenbedingungen. Für dieses vermeintlich durch Big Data 
problemlos erreichbare Ziel muss dann mithin auch mit überholten Überzeugun- 
gen bezüglich einer informationellen Selbstbestimmtheit und Vorstellungen von 
Privatheit gebrochen werden oder diese müssen zumindest fundamental überdacht 
werden (Donaldson & Lohr, 1994; Sharon & Lucivero, 2019). All dies wurde und 
wird mit Blick auf Big Data laufend kommunikativ verhandelt. 


The world must be changed in order to achieve an idealized state, and discussions of 
such change must elaborate how present reality operates deficiently, and what poli- 
tical, economic, social (etc.) factors must be manipulated in order to eliminate the 
deficiencies. (Abelson, 1979, S. 357) 


Der Diskurs um die Chancen und Risiken von Big Data bedient mithin die weiter- 
fiihrenden kommunikativen Merkmale von Glaubenssystemen. Zusammengefasst 
lässt sich daher sagen, dass aus den Beschreibungsdimensionen, anhand derer sich 
Big Data definieren lässt, auch die Elemente eines BDGS abgeleitet werden kön- 
nen. Ausgehend von der Diskussion der Beschreibungsdimensionen von Big Data 
in Kapitel 3 zeigt sich, dass es sich nicht um ein feststehendes faktengebundenes 
Wissenssystem handelt, innerhalb dessen gesicherte und allgemein anerkannte 
Fakten vorliegen, die von den Beteiligten als wahr erachtet werden. Sondern es 
werden unterschiedlich weitreichende Annahmen und Erwartungen formuliert, 
die wie beschrieben Wesensmerkmale eines Glaubenssystems repräsentieren kön- 
nen. Mit Rückbezug auf Abelson (1979) wurde gezeigt, dass insbesondere für 
Annahmen von Richtigkeit und Nutzen von Big Data unterschiedliche Wahr- 
nehmungen und Widersprüche in der wissenschaftlichen Literatur besprochen 
werden, die eben nicht als faktisch und gesichert erachtet werden, sondern zu 
variablen Einschätzungen und Erwartungen führen können. Es besteht mithin 
kein Konsens über das Wesen von Big Data und seine einzelnen Beschrei- 
bungsdimensionen, weder, welche Dimensionen Big Data zu dem machen, was 
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sie sind, noch ob sich Annahmen, die mit einzelnen Beschreibungsdimensio- 
nen verknüpft sind, uneingeschränkt gelten. Auf ihrer Grundlage kann fernab 
einer Beschäftigung mit einzelnen Fallbeispielen, an denen sich ein Glaube 
diskursiv analysieren ließe, abstrahiert auf die generalisierte gesellschaftliche 
Erwartungshaltung bezüglich der Wirkmacht oder Wirklosigkeit der Sammlung 
und Auswertung großer digitaler Datenbestände abgestellt werden. 
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Fragen nach der Ausprägung eines 7 
Glaubens an Big Data und dessen 

Einfluss auf Einstellungen zum Einsatz 

von Kl-Anwendungen 


Die Auswirkungen der gesellschaftlichen Perspektive auf die digitalisierte Welt 
verdienen es, umfassend analysiert und kritisiert zu werden. Über ihre positi- 
ven und negativen Auswirkungen lässt sich jedoch nur diskutieren, wenn man 
kollektive Wahrnehmungen zunächst tatsächlich aufzeigen kann. Es bedarf daher 
zuallererst einer empirischen Bestandsaufnahme der Ausprägung und Reichweite 
jener zuvor skizzierten Elemente einer kognitiven Erwartungshaltung, die als aus- 
geprägter Glaube an daten-induzierte Erkenntnis und Nutzen bestehen soll. Ziel 
ist es daher, die Wahrnehmung bezüglich des Wesens und der Konsequenzen 
umfassender digitaler Datensammlung und -verwertung einer empirischen sozi- 
alwissenschaftlichen Analyse zuzuführen. Der Glaube an Big Data kann dabei 
nicht in den digitalen Datenmengen selbst gefunden werden. Er lässt sich nur 
in den Köpfen der Menschen verorten, die die gesellschaftlichen Erzählungen 
über digitale Daten und Wissen, insbesondere im öffentlichen Diskurs, aufneh- 
men und vor dem Hintergrund individueller (Primär-)Erfahrungen einordnen und 
bewerten. Die vorhergehenden Ausführungen haben dabei deutlich gemacht, dass 
dieser Diskurs unter den Vorzeichen der voranschreitenden Digitalisierung auf das 
Entstehen einer Wissensgesellschaft abstellt, zu deren grundlegenden Elementen 
die ubiquitäre Durchdringung und Verwendung von IuK gehört. Mit Blick auf 
die im Rahmen dieser Digitalisierung entstehenden und verarbeiteten digitalen 
Daten wurden die wesentlichen Charakteristika von Big Data herausgearbeitet. 
Gleichzeitig wurde jedoch auch deutlich, dass die an Big Data gestellten Erwar- 
tungen nicht immer eingelöst werden können und bezüglich ihres Wesens und 
ihrer Konsequenzen problembehaftet sind. Es stellt sich mithin die Frage, inwie- 
weit die deutsche Bevölkerung entsprechende Erwartungen an einen Erkenntnis- 
und Nutzengewinn durch digitale Daten, bestehend aus den Erwartungsdimensio- 
nen bezüglich der Richtigkeit, des Wissensgewinns sowie des individuellen und 
gesellschaftlichen Nutzens (siehe Abschnitt 6.2.1), tatsächlich hegt und in einem 
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zusammenhängenden Glaubenssystem integriert hat. Deshalb werden zunächst 
folgende allgemeine Forschungsfragen formuliert, die beantwortet werden sollen: 


FFI: Inwieweit lässt sich der Glaube an Big Data in seinen mehrdimensionalen 
Bezugspunkten von Überzeugungen als empirisches Konstrukt messen? 

FF2: Welche Ausprägung haben die einzelnen Überzeugungen eines Glaubens 
an Big Data und in welcher Beziehung stehen sie zueinander? 


Erst anschließend lassen sich eventuelle Konsequenzen des als BDGS beschriebe- 
nen Wahrnehmungsmusters für Einstellungen und soziales Handeln untersuchen, 
die, wie zuvor diskutiert, vielfach in der Literatur thematisiert werden. Dabei 
interessieren vor allem die vermeintlichen Auswirkungen des Glaubens bezüglich 
digitaler Daten für Legitimation und Delegitimation von Handeln und Ent- 
scheiden in der Datengesellschaft, wenn es um den fortschreitenden Einsatz 
datenverarbeitender Computeranwendungen geht. Es stellt sich die Frage, inwie- 
weit eine kognitive Aktivierung des BDGS einen Einfluss auf entsprechende 
kognitive, affektive und konative Komponenten der Einstellung nimmt, die in 
unterschiedlichen Situationen zum Tragen kommen (Maio et al., 2018). So kann 
über mögliche Auswirkungen von gesellschaftsweiter Einführung und Verbrei- 
tung einer Innovation vorzüglich gestritten werden: Tatsächliche Konsequenzen 
zeigen sich mitunter erst mit einiger zeitlicher Verzögerung. Oft ist im Nachhin- 
ein nicht mehr fein säuberlich herauszuarbeiten, welchen Einfluss die individuelle 
und gesellschaftliche Wahrnehmung und die hieraus erwachsene Erwartungshal- 
tung auf die Diffusion von Innovationen tatsächlich hatten. Umso wichtiger ist 
es, fortlaufend und anhand möglichst aktueller Beispiele zu untersuchen, auf 
welche Erwartungshaltung technische Innovationen in der Bevölkerung treffen 
und wie diese auf die Implementierung der Systeme reagiert. Dies soll bezüglich 
des Einsatzes von datenbasierten Systemen Künstlicher Intelligenz nachfolgend 
untersucht werden. Hierbei soll folgende Forschungsfrage beantwortet werden: 


FF3. Inwiefern wirken sich Überzeugungen des Glaubens an große digitale 
Datenbestände auf Einstellungen zum Einsatz von KI-Anwendungen aus? 


Mit empirischer Evidenz fundiert kann so ein gesellschaftlicher Diskurs über den 
Einsatz datensammelnder und -verwertender Computertechnik informiert werden. 
Die öffentliche Meinung als Treiber zukünftiger Entwicklungen kann dann — so 
die Hoffnung - reflektiert Innovationen und Maßnahmen legitimieren bzw. alther- 
gebrachte Ansätze delegitimieren und somit den Weg für eine aktive Gestaltung 
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kommender Wandlungsprozesse ebnen. Immerhin befinden wir uns erst unmittel- 
bar am Anfang der Digitalisierung und ihrer Konsequenzen für die Gesellschaft. 
Es handelt sich mithin um einen langfristigen Prozess, der in den kommenden 
Jahrzehnten den sozialen Wandel in Deutschland und der Welt beeinflusst. Die- 
ser Wandel soll und wird zivilgesellschaftlich und politisch gestaltet werden. Die 
nachfolgenden Erkenntnisse sind ein erster allgemeiner Beitrag zu einer dringend 
notwendigen empirisch angeleiteten Selbstreflexion über die gesellschaftliche 
Perspektive auf den vielfach diskutierten digitalen Wandel. 
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Methodik der Skalenkonstruktion für 8 
das Big-Data-Glaubenssystem und 
erste empirische Evidenzen 


An dieser Stelle beginnt der empirische Teil der vorliegenden Arbeit, der zum 
einen in diesem Kapitel 8 einen Vorschlag unterbreitet, wie man das Big- 
Data-Glaubenssystem (BDGS) einer empirischen Messung zuführen kann und 
wie die einzelnen konzeptuellen Dimensionen des BDGS im Rahmen die- 
ser zu entwickelnden Messung operationalisiert werden können. Zum anderen 
sollen Untersuchungsergebnisse referiert werden, die erste Erkenntnisse über 
die Ausprägung des BDGS in der deutschen Bevölkerung (siehe Kapitel 9) 
und den Einfluss des BDGS auf kognitive, affektive und konative Komponen- 
ten der Einstellung in unterschiedlichen Lebensbereichen berichten, in denen 
KI-Anwendungen zum Einsatz kommen (siehe Kapitel 10). 

Daher wird in den folgenden Abschnitten zunächst die Durchführung der Ska- 
lenkonstruktion dokumentiert und eine Messung vorgeschlagen, deren Einsatz in 
einer ersten Studie mit drei Erhebungen entwickelt und getestet wurde. Das empi- 
rische Vorgehen soll nachfolgend detailliert und intersubjektiv nachvollziehbar 
beschrieben werden, um den Aufbau und die Verwendung der Skala als zentra- 
les Werkzeug der Arbeit zu erläutern und eine mögliche Datenanalyse für die 
produzierten Beobachtungen vorzuschlagen. Die Ausführungen orientieren sich 
dabei an den in der Literatur zur Testkonstruktion empfohlenen Richtlinien aus 
der Literatur zur Methodenforschung der standardisierten Befragung, allen voran 
an denen von (Bühner, 2011), sowie den Empfehlungen zur Skalenentwicklung 
von Carpenter (2017) und Bandalos (2017). 


Ergänzende Information Die elektronische Version dieses Kapitels enthält 
Zusatzmaterial, auf das über folgenden Link zugegriffen werden kann 
https://doi.org/10.1007/978-3-658-36368-0_8. 
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Generell sollen die Beschreibungsdimensionen der Definition des Phänomens 
Big Data und ihr Wesensgehalt, der sich in einer Erwartungshaltung bezüglich der 
Potentiale von Big Data und digitalen Daten ausdrückt, in messbare Indikatoren 
überführt werden, deren jeweilige Messung eine Auskunft über das Vorhanden- 
sein oder eben die Abwesenheit der jeweiligen Überzeugungen gibt. Dabei sind 
die Bürger*innen Merkmalsträger*innen und deren Erwartungshaltung mit Bezug 
auf die digitalen Daten das zu untersuchende Merkmal (Brosius et al., 2008). 
Das BDGS und seine zugehörigen Dimensionen lassen sich — wie bei sozialwis- 
senschaftlichen Konstrukten üblich — nicht direkt und unmittelbar beobachten; 
ihre Messung muss daher empirisch operationalisiert werden (Bandalos, 2017; 
Weiber & Mühlhaus, 2014). 


8.1 Die Operationalisierung und Messung von Glauben 
und Glaubenssätzen mit Hilfe der standardisierten 
Befragung 


Die vorliegende Arbeit zielt darauf ab, Personen nach der Stärke der Ausprägung 
des individuellen Glaubens an Charakteristika und Konsequenzen digitaler Daten 
und ihrer Verwertung zu unterscheiden. Wie zuvor ausgeführt, gibt es innerhalb 
des BDGS mitunter Überzeugungen, die dazu führen, eine ganz unterschiedliche 
Bewertung dieser digitalen Daten in ihrem Entstehungs- und Verwertungskontext 
vorzunehmen. Doch wie gelingt diesbezüglich eine Unterscheidung, kann man die 
Existenz und Stärke des Glaubens den jeweiligen Personen ja eben nicht von den 
Lippen ablesen. Das BDGS, das sich auf Glauben an digitale Daten bezieht, kann 
nicht aus eben jenen bestehenden großen digitalen Datenbeständen herausgelesen 
werden, sondern muss anhand geeigneter Indikatoren erhoben werden (Hubbard, 
2010). Entsprechende Daten müssen aktiv produziert werden. Dabei ist das Glau- 
benssystem immateriell oder in anderen Worten: nicht greifbar. Es ist jedoch über 
die Reproduktion von Aussagen bezüglich eigener Glaubensüberzeugungen und 
die Zustimmung oder Ablehnung zu diesen zu operationalisieren und zu mes- 
sen. Eine Person, die einen ausgeprägten Glauben an einzelne Dimensionen des 
Wesens und der Konsequenzen von Big Data hat, sollte in der Befragungssitua- 
tion entsprechend Aussagen, die den digitalen Daten nun bspw. eine Eigenschaft 
wie detailgetreue Realitätsabbildung oder positive Konsequenzen für das Selbst 
zuschreiben, entsprechend zustimmen. Die (Nicht-)Zustimmung zu den Glaubens- 
sätzen, also manifeste Äußerungen der Merkmalsträger, dienen als Indikatoren 
für die jeweilige konkrete Ausprägung des BDGS, die dokumentiert werden und 
Rückschlüsse zulassen. Genauer werden den Biirger*innen Aussagen zu digitalen 
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Datenbeständen vorgelegt und sie sollen als Befragte selbst dazu Auskunft geben, 
inwieweit sie den Aussagen zustimmen oder auch nicht. 

Der Ansatz folgt dabei sozialwissenschaftlicher Forschung, die ebenfalls 
darum bemüht ist, die Messung von Glaubenssätzen mittels standardisierter 
Itembatterien für Befragungsstudien zu ermöglichen. Entsprechende Befragungs- 
instrumente wurden unter dem Stichwort der Messung von Glaubensüberzeu- 
gungen u. a. für die Erwartungshaltung mit dem zukünftigen Umgang mit 
positiven Emotionen vorgeschlagen (F. Bryant, 2011) und werden auch bei der 
Analyse politischer Überzeugungen eingesetzt (Baldassarri & Goldberg, 2014; 
Boutyline & Vaisey, 2017; Brandt et al., 2019). 

Zuvor wurde dabei der Begriff des Messens unter den Bedingungen von 
Daten und seine Bedeutung für diese Arbeit bereits ausführlich aus analytischer 
Perspektive reflektiert. Für das handwerkliche Verständnis des Messens bei der 
empirischen Erhebung des BDGS im Rahmen von Sozialforschung wird sich 
nachfolgend hingegen an folgender Definition von Friedrichs (1990) orientiert. 
Hier bedeutet 


Messen die systematische Zuordnung einer Menge von Zahlen oder Symbolen zu den 
Ausprägungen einer Variable, mithin auch zu den Objekten. (...) Die Zuordnung (oder 
genauer: Abbildung) sollte so erfolgen, dass die Relationen unter den Zahlenwerten 
den Relationen unter den Objekten entsprechen. (S. 97, Hervorh. im Orig.) 


Bei der standardisierten Befragung kommen also Fragen zum Einsatz, die in 
ihrem Einsatz in einer Skala oder Fragenbatterie auch als Items bezeichnet 
werden. Diese Fragen werden mithin im Folgenden als (Frage-)Items oder 
Indikatoren bezeichnet und die entsprechenden Begriffe synonym verwendet. ! 


8.2 Die Operationalisierung von Messung von Glauben 
als reflektives latentes Konstrukt 


Dabei folgt diese Messung von Glauben der Logik reflektiver Messmodelle, 
а. h., ein nicht unmittelbar beobachtbares latentes Konstrukt wird über die 


' Es wird an der jeweiligen Stelle im Text deutlich gemacht, ob von der Gesamt- oder Sub- 
Skala, also der gesamten Itembatterie, oder einem Teilausschnitt dieser Batterie gesprochen 
wird. Ein Teilausschnitt umfasst dabei meist immer eine konkrete Dimension des BDGS. 
Skala kann sich jedoch auch auf das Messniveau und die den Befragten vorgegebenen stan- 
dardisierten Antwortoptionen der Fragen einer Itembatterie beziehen (siehe Abschnitt 8.4.6). 
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Erhebung von Messindikatoren (sogenannten manifester oder auch beobacht- 
baren Variablen) operationalisiert. Die Ausprägung des latenten Konstrukts auf 
Seiten des untersuchten Subjekts beeinflusst die jeweilige Ausprägung eines 
Indikators. Dabei werden alle Befragten mit den gleichen vorformulierten Glau- 
bensüberzeugungen des BDGS konfrontiert und es verorten sich alle Befragten 
auf der gleichen abgestuften Antwortskala (Bandalos, 2017). Die Ausprägung der 
Erwartungshaltung und ihrer zugehörigen Dimensionen wird auch als ein empi- 
risches Relativ verstanden, das nun mittels Messung möglichst strukturgleich in 
ein numerisches Relativ überführt wird (Brosius et al., 2008; Rössler, 2017). 
D. h., der jeweiligen Ausprägung des empirischen Relativs wird systematisch 
ein Zahlenwert zugewiesen und erlaubt für registrierte Äußerungen im Aggregat 
eine vergleichende statistische Auswertung mittels Strukturgleichungsmodellie- 
rung und konfirmatorischer Faktorenanalyse (Kline, 2011; Weiber & Mühlhaus, 
2014). Anhand eines Beispiels mit Bezug auf das BDGS verdeutlicht: Je aus- 
geprägter also die Glaubensüberzeugung bei einer Person, dass die digitalen 
Daten einen Nutzen für die Gesellschaft haben, desto eher stimmt diese Per- 
son auch in der Befragungssituation einer Aussage zu, die diesen Nutzen für die 
Gesellschaft postuliert. Die befragte Person signalisiert die Zustimmung durch ein 
vorgegebenes Antwortschema, was im vorliegenden Fall digital registriert wird. 
Der Zustimmung wird ein hoher Zahlenwert zugewiesen. Wird hingegen in der 
Befragungssituation Nicht-Zustimmung signalisiert und ein Nutzen verneint, wird 
ein niedrigerer Zahlenwert festgehalten. Die Wirkungsrichtung läuft also vom 
zu messenden, nicht unmittelbar zu beobachtenden Konstrukt hin zur tatsäch- 
lich geäußerten Zustimmung, die im Rahmen des standardisierten Instruments 
registriert wird. 

Der Glaube, dass digitale Daten bestimmte epistemische Charakteristika besit- 
zen und im Stande sind, einen Nutzengewinn herbeizuführen, soll also mittels 
Befragung und somit Selbstauskunft der Befragten erhoben werden. Zwar könnte 
auch in Erwägung gezogen werden, die Ausprägung des BDGS durch Beobach- 
tung des Verhaltens und der Handlungen von Personen zu erheben oder durch eine 
Dokumentation und anschließende Inhaltsanalyse ihrer aufgezeichneten Äuße- 
rungen. Die Befragung, und hier insbesondere eine standardisierte Form der 
Befragung auf Grundlage eines psychometrischen Tests, scheint jedoch besonders 
geeignet, einen ersten Aufschluss über die Valenz und Stärke der individuel- 
len Erwartungshaltung zur epistemischen Qualität und dem hieraus gezogenen 


2 Zum Unterschied zwischen isomorpher und homomorpher Abbildung des empirischen 
Relativs in ein numerisches Relativ siehe Brosius et al. (2008, S. 49): Im vorliegenden Fall 
ist die Abbildung homomorph, was bedeutet, dass die Zuordnung „nicht mehr eindeutig 
umkehrbar ist“. 
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Nutzen digitaler Daten zu geben und diese über Befragte und unterschiedliche 
Stichproben hinweg vergleichbar zu machen. 

Allein aus ökonomischen Gründen ist die zunächst zwar aufwändige, dann 
jedoch beliebig oft anzuwendende Erarbeitung eines standardisierten Befragungs- 
instruments sinnvoll, bei dem einige wenige Fragen mit Hilfe sich wiederholender 
vorgegebener Antwortmöglichkeiten in kurzer Zeit aus der Ferne ausgespielt wer- 
den können. Diese Erhebungs- und Messkonzeption ermöglicht daher besonders 
gut das Festhalten einer standardisiert quantifizierbaren Messung reproduzierter 
Überzeugungen des BDGS. 

Bevor jedoch die Testkonstruktion im Detail erläutert wird, sei bereits ein Hin- 
weis gegeben, der auch unter Reflexion und Methodenkritik aufgegriffen wird: 
Sozialwissenschaftliche Messungen sind nicht perfekt und stellen lediglich Annä- 
herungen an das abzubildende, nicht unmittelbar zu beobachtende Konstrukt dar, 
da es nicht die eine richtige Messung gibt (Bandalos, 2017). Testkonstruktionen 
sind mitunter fehlerbehaftet und setzen ein Bewusstsein und eine stetige Refle- 
xion über diese Fehlbarkeit voraus, die sich aus unterschiedlichen Fehlerquellen 
ergeben kann (Weisberg, 2009). Auch wenn die nachfolgende Auswertung die 
Möglichkeit des Messfehlers zulässt (Kline, 2011; Weiber & Mühlhaus, 2014): In 
den nachfolgenden Ausführungen müssen alle Entscheidungen auf dem Weg zur 
Messung des BDGS ausführlich begründet und ihre Pro- und Contra-Argumente 
abgewogen werden? 


Das Testziel der ‚Big-Data-Glaubenssystem‘-Skala 

Bevor auf die konkreten Entscheidungen bei der Konstruktion der Skala und der 
Formulierung ihrer Items eingegangen werden kann, muss zunächst ein allgemei- 
nes Testziel festgelegt werden, das die einzelnen Entscheidungen leitet, die bei 
der Skalenentwicklung getroffen werden. Das Testziel besteht in der vorliegen- 
den Arbeit darin, die Perzeptionen der Bürger*innen von Big Data und der mit 
Big Data verbundenen Datafizierung und Quantifizierung messbar zu machen. Es 
wird hier auf eine Erwartungshaltung abgestellt, die als BDGS im vorigen Teil der 
Arbeit konzeptuell beschrieben wurde. Die Messung durch standardisierte Befra- 
gung stellt hierbei also insbesondere auf Glaubensüberzeugungen bezüglich der 
in Abschnitt 3.5.1 bzw. Abschnitt 3.5.2 besprochenen Beschreibungsdimensionen 
Richtigkeit (Veracity) und Nutzen (Value) großer digitaler Datenbestände ab, die 
auch als Big Data bezeichnet werden. 


3 Vermeintliche Fehler sind dem Verfasser anzulasten, wobei die Dokumentation der empi- 
rischen Datenerhebung und der spezifizierten Modelle es Dritten mit Hilfe der Daten im 
Anhang im elektronischen Zusatzmaterial erlauben, das empirische Vorgehen bei Datener- 
hebung und -auswertung zu prüfen. 
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In der Anfangsphase der vorliegenden Forschungsarbeit wurde zunächst auch 
erwogen, noch zusätzlich zwischen den drei Momenten der Entstehung, Spei- 
cherung und Auswertung von digitalen Daten unterscheiden zu wollen. Zudem 
wurde eine Bewertung des Ausmaßes, der Geschwindigkeit und der Vielfalt 
digitaler Datenentstehung und -verwertung erfragt. Diese feinteilige konzeptu- 
elle Unterscheidung ist empirisch jedoch kaum oder gar nicht abzubilden, da 
etwaige Feinheiten in den entsprechenden (Item-)Formulierungen nur unzurei- 
chend wahrgenommen werden und sich im Aggregat nicht abbilden lassen. Siehe 
hierzu die entsprechenden Ergänzungen in Abschnitt 1.1 im Anhang im elektro- 
nischen Zusatzmaterial. Auf die jeweiligen Unterscheidungen wird nachfolgend 
nur jeweils an Stellen eingegangen, an denen ihr diskutierter Bezug zur Messung 
wichtig wird und zum Verständnis der empirischen Untersuchung beiträgt. Dies 
ist der Notwendigkeit der transparenten Dokumentation durchgeführter Forschung 
geschuldet. 


83  Befragungsitems als manifest beobachtbare 
Indikatoren der Messung der latenten Konstrukte 
des BDGS 


Bei der Festlegung der Art der Indikatoren soll nach Bühner (2011),,die Frage 
beantwortet werden, ob der Test anhand objektiver oder subjektiver Indikatoren 
ein Konstrukt erfassen soll“ (S. 85). Da das zu erhebende Charakteristikum — 
anders als bei einem Wissenstest — keine eindeutige Falsch- oder Richtig- 
Klassifizierung erlaubt, sondern über Ratings und somit sogenannte Q-Daten 
(Questionnaire data) abgebildet wird, handelt es sich um subjektive Indika- 
toren, die mittels Selbstauskunft der Befragten deren Überzeugungen messen 
sollen (Cattell, 1973). Diese Überzeugungen, als zu messendes mehrdimen- 
sionales Konstrukt, meint die individuelle Erwartungshaltung bezüglich großer 
digitaler Datenbestände, also das zuvor beschriebene Big-Data-Glaubenssystem 
mit seinen Dimensionen Richtigkeit und Nutzen. Es gibt mithin keine richtigen 
oder falschen Aussagen, sondern es wird die jeweilige individuelle Zustimmung 
der Befragten zu allgemein gehaltenen Aussagen über die zuvor besprochenen 
Beschreibungsdimensionen von Big Data erfragt. Die Aussagen fungieren dann 
wie beschrieben als Indikatoren des zu messenden Konstrukts: Die konkrete Ein- 
schätzung der Aussagen durch die Befragten bildet die Ausprägung des jeweiligen 
Indikators ab. Wird einer allgemein gehaltenen Aussage aus einer Dimension 
umfassend zugestimmt, signalisiert dies das Vorhandensein einer Erwartungs- 
haltung mit Bezug zu den digitalen Daten. Wird dieser Aussage jedoch nicht 
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zugestimmt, indiziert dies eine nicht vorhandene Erwartungshaltung auf Seiten 
der befragten Person. Die Messindikatoren, über die das latente Konstrukt opera- 
tionalisiert wird, reflektieren dessen Ausprägung. Sie werden daher nachfolgend 
in ein reflektives Messmodell überführt, das eine Prüfung ihrer dimensionalen 
Struktur erlaubt. 


84 Zur Operationalisierung der latenten Konstrukte des 
Big-Data-Glaubenssystems - Voraussetzungen der 
Konzeption von geeigneten Indikatoren 


Nachdem nun das Ziel und die Logik der Konstruktmessung erörtert und die Art 
der geeigneten Indikatoren festgelegt wurden, folgen nun allgemeine Uberlegun- 
gen zur Ausgestaltung der Indikatoren in der Befragung. Bei der Formulierung 
der Indikatoren muss zunächst bedacht werden, welche Zielgruppe später einmal 
mit dem Befragungs-Instrument konfrontiert wird, um mögliche problematische 
Einflüsse auf die Messung durch bestimmte Eigenheiten der Befragten (bspw. 
Einflüsse der Soziodemografie, des Sprachverständnisses sowie des Erlebens- und 
Verhaltensspektrums) zu vermeiden (Bühner, 2011). Weiterhin müssen weitere 
Entscheidungen getroffen werden, die die Messung betreffen, wie bspw. die Ska- 
lierung der Items und die Benennung der Skalierungspunkte sowie die Einleitung, 
Darstellung und Aufteilung der Skala im Fragebogen (Scholl, 2018). Die fol- 
genden Abschnitte formulieren die einzelnen Ansprüche, die an Skala und Items 
gestellt werden, und dokumentieren, wie diese bei der Testkonstruktion des BDGS 
umgesetzt wurden. 


8.4.1 Festlegung der Zielgruppe des Tests 


Bereits zu Beginn der Entwicklung eines Tests sollte nach Bühner (2011) fest- 
gelegt werden, „welche Zielgruppe den zu entwickelnden Test später einmal 
bearbeitet sowie deren Merkmale zu beschreiben, die für die Testbearbeitung 
relevant sein könnten“ (S. 87). Denn: „Für die Testkonstruktion werden schon 
durch die Definition der Zielgruppe die Weichen für das Format des Tests, die 
Itemschwierigkeit und die Itemformulierung gelegt“ (S. 91). Grundsätzlich sollte 
ein Test für die Prävalenz des BDGS für alle deutschsprachigen Bürger*innen 
der Bundesrepublik Deutschland geeignet sein, so dass eine Verwendung in 
Repräsentativbefragungen grundsätzlich möglich ist. Es ist also weitgehend uner- 
heblich, wie ausgeprägt die Kenntnisse der Befragten über die Digitalisierung 


104 8 Methodik der Skalenkonstruktion ... 


und allgemeine Erfahrung mit Internetnutzung sind oder ob konkretes techni- 
sches Wissen über mögliche Aspekte ebenjener digitalen Daten oder Big Data 
vorliegt, die über basale Vorstellungen und lose Assoziationen hinausgehen. 

Gerade eine tiefergehende Auseinandersetzung mit digitaler Technologie und 
Daten wird für das Gros der deutschen Bevölkerung eben nicht angenom- 
men. Diese kommt in Beruf und Alltag nicht unmittelbar mit großen digitalen 
Datenmengen und der (Daten-)Analyse von Big Data in Berührung. Selbst 
Expert*innen wie bspw. hauptberuflich Forschende oder etwa privatwirtschaft- 
lich angestellte Data Scientists bekommen immer nur einen überschaubaren Teil 
der Daten zu Gesicht und haben unmöglich einen vollständigen Überblick über 
Bestand und Einsatz der Daten in Wirtschaft und Verwaltung sowie die aus den 
Daten gewonnen Erkenntnisse und die Auswirkungen, die sich aus diesen Daten 
ergeben. Das hat zur Konsequenz, dass womöglich nicht alle Bürger*innen über- 
haupt etwas mit diesem Begriff Big Data anfangen können. So stellen auch Orwat 
und Schankin (2018) fest: “The many definitions, understandings, and general 
ambiguity of the term ‘big data’ do not allow for direct work with this term 
in a survey” (S. 1). Daher wird an den entscheidenden Stellen in der Befra- 
gung wie etwa Einleitungstexten und Itemformulierungen von ‚großen digitalen 
Daten(beständen)‘ gesprochen. 


8.4.2 Berücksichtigung möglicher Herausforderungen bei 
der Testkonzeption durch sozio-demografische 
Merkmale der Befragten 


Die allgemein gehaltene Zielgruppe der deutschsprachigen Bundesbiirger*innen 
bedeutet mithin auch, dass der Test für alle Alters- und Bildungsstufen anwendbar 
sein sollte. Das hat vor allem Konsequenzen für die sogenannte psychometrische 
Itemschwierigkeit, da bspw. die Nutzung digitaler Medientechnologien durch das 
Alter beeinflusst wird (Seifert, 2016). Junge und hochgebildete Personen haben 
wahrscheinlich einen anderen Zugang zu einem Thema, das einen gewissen tech- 
nischen Anspruch hat, und können aufgrund eines Wissensvorsprungs, der aus 
größerer Nutzungserfahrung entspringt, bestimmten Items nicht nur eher, sondern 
möglicherweise auch anders zustimmen als technisch unerfahrene Personen. Es 
besteht mithin die Möglichkeit, dass für spezielle Untergruppen der Zielgruppe 
Probleme bei der Skalenkonstruktion und der letztendlichen Befragung zum 
BDGS zu erwarten sind, die über die üblichen Probleme und Herausforderungen 
der Befragungsforschung hinausgehen (Scholl, 2018). 
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Allerdings sollte eine Vertrautheit mit den allgemeinen technischen Begriff- 
lichkeiten im Bereich Internet und Computer vorauszusetzen sein. Es wird 
erwartet, dass die Begriffe ‚Digitalisierung‘ bzw. ‚digital‘ und auch ‚Daten‘ 
bekannt sind und ein Alltags- bzw. Laienverständnis vorliegt, ohne dass die 
jeweiligen Befragten dazu befähigt sein müssen, eine präzise Definition wie- 
derzugeben. Da es ja um die allgemeinen Perzeptionen von Big Data und eine 
diesbezügliche individuelle Erwartungshaltung geht und nicht bspw. um einen 
Wissenstest, sollte der Einfluss von Alter und Bildung zumindest auf die all- 
gemeine Beantwortbarkeit der gestellten Fragen minimal sein. Alle Befragten 
sollten ein Verständnis von Datenerzeugung und -speicherung durch digitale 
Medien aus persönlicher Erfahrung sowie medienvermittelten Erzählungen mit- 
bringen. Dass digitale Medientechnik Daten erzeugt und speichert, ist seit Jahren 
und auch aktuell Gegenstand öffentlicher Diskussionen (Knorre et al., 2020; 
Zeller et al., 2010). Alle potentiellen Befragten sollten durch die regelmäßigen 
Hinweise zu Datenerhebung und Datenschutz bei der Nutzung digitaler sowie 
nicht-digitaler Angebote auch damit vertraut sein, dass sie in gewissem — wenn 
auch nicht vollumfänglich nachvollziehbarem — Umfang laufend ihre Daten preis- 
geben und sich Unternehmen und Dienstleister vorbehalten, diese Daten für 
eigene Zwecke zu nutzen, ohne dass hiermit gleich eine kommerzielle Nutzung 
gemeint ist. So wird man beim Arztbesuch bedingt durch das Inkrafttreten der 
DSGVO im Mai 2018 neuerdings um die Einwilligung in Datenerhebung und 
-speicherung gebeten (Wensing, 2018). 

Lediglich mit Bezug auf die technische Auswertbarkeit der Daten kann 
es durchaus unterschiedliche Vorstellungen geben. Allerdings sollte auch hier 
weitgehend klar sein, dass etwas mit den erzeugten und gespeicherten Daten 
geschieht, selbst wenn sich das explizite Wissen um die konkreten Auswertungs- 
möglichkeiten zwischen einzelnen Gruppen unterscheiden mag. 


Herausforderungen der BDGS-Messung bei älteren Befragten 

Es muss jedoch diskutiert werden, inwieweit ältere Befragte — eine Gruppe, in der 
sich viele Nicht-Nutzer digitaler Medientechnologien befinden (Seifert & Schel- 
ling, 2018) — sich möglicherweise mit der Beantwortung schwertun und es zu 
Verständnisproblemen in der Befragungssituation Kommt. 

Die Mehrheit der älteren Befragten sollte unter normalen Umständen in der 
Lage sein, die Befragungsitems sinnhaft zu beantworten. Um dies sicherzustellen, 
sollten die Frageitems mit einer Einleitung versehen werden, die ein Grundver- 
ständnis für das herstellt, was im Fragebogen unter digitalen Daten verstanden 
wird. Der Einleitungstext zum Test wird in Abschnitt 8.4.7 dokumentiert. Es sind 
hier des Weiteren keine oder vernachlässigbare Probleme mit Blick auf ältere 
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Befragte zu erwarten, da „besondere Problemgruppen unter den Älteren übli- 
cherweise in Surveys gar nicht oder nur selten befragt werden: die ganz Alten 
(Personen über 75 oder 80 Jahre), die institutionalisierten Alten und die (meist 
geistig) Labilen (Demente)“ (Kühn & Porst, 1999, S. 27). Mit Blick auf den nach- 
folgend dokumentierten Einsatz der BDGS-Skala in diversen Erhebungen wird 
deutlich werden, dass jene Personen der ganz Alten in vernachlässigbarer Anzahl 
teilgenommen haben. Dies liegt schon darin begründet, dass die durchgeführten 
Befragungen online stattfanden, was nachfolgend diskutiert wird. Dennoch kann 
diese Befragtengruppe nicht gänzlich vernachlässigt werden, da sie doch gleich- 
sam zur Grundgesamtheit zählt und einen beachtlichen und zunehmenden Anteil 
an der Wahlbevölkerung umfasst (Falter & Gehring, 1998). Etwaige Problemla- 
gen müssen mithin mit Blick auf den zukünftigen Einsatz einer BDGS-Skala je 
nach Forschungsinteresse berücksichtigt werden. Zusammengefasst bedeutet dies 
zunächst, dass es keine Gruppe unter den potentiellen Befragten geben sollte, 
die aufgrund soziodemografischer Merkmale durch das Instrument systematisch 
benachteiligt wird und keine valide Beantwortung des Tests erbringen könnte. 


8.4.3 Berücksichtigung möglicher Herausforderungen bei 
der Testkonzeption durch das Erlebens- und 
Verhaltensspektrum der Befragten 


Es gibt ebenso eine ganze Reihe von Personen mit einer spezifischen Perspektive 
auf ihr eigenes Erlebens- und Verhaltensspektrum im Rahmen digitaler Daten. 
Bspw. diejenigen, die aus der eigenen intensiven Beschäftigung mit digitalen 
Daten eine spezielle Wahrnehmung entwickelt haben, die auf die Beantwortung 
der zu entwickelnden Skala durchschlägt. Gemeint sind hier allen voran Techni- 
kaffine aus dem Spektrum der Self-Tracker und der Quantified-Self-Bewegung, 
für die ebenfalls die Itemschwierigkeit bedacht werden muss (Nafus & Sherman, 
2014; Neff & Nafus, 2016). Diese Personen entstammen möglicherweise einem 
anderen Erlebens- und Verhaltensspektrum und es könnte für sie mithin einfacher 
sein, die Testfragen zu beantworten. Gleiches könnte auch für Expert*innen auf 
dem Gebiet der Digitalisierung zutreffen, die aufgrund ihres beruflichen Hinter- 
grunds und der Nähe zu Themen der Digitalisierung ein entsprechend verändertes 
Erlebens- und Verhaltensspektrum aufweisen (van der Aalst, 2014). 

Allerdings sollte bei der Skalenkonstruktion so allgemein über die Qualität von 
großen Datenmengen für einen Erkenntnis- und Nutzengewinn befragt werden, 
dass es analog zu Alter und Bildung keinen fundamentalen Unterschied zwischen 
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dieser Gruppe und anderen Gruppen gibt, die einer reliablen und vor allem vali- 
den Beantwortung des Tests in diesen speziellen Gruppen entgegensteht. Es liegt 
in der Natur des Tests, dass eben solche Personen, die sich ausgiebig beruflich 
oder privat mit der Digitalisierung oder mit digitalen Daten beschäftigen, eine 
andere Sicht auf die Befragungsitems haben. Jedoch ist dies noch kein Hinweis 
darauf, dass das BDGS bei diesen Personen, wenn auch möglicherweise anders 
ausgeprägt, mit der vorgeschlagenen Messung überhaupt nicht zu erfassen sein 
sollte, etwa, weil diese Personen etwas gänzlich anderes unter digitalen Daten 
verstehen, als es die vorliegende Skalenkonstruktion untersucht.* 


Herausforderungen der BDGS-Messung bei Offlinern 

Es ist hingegen durchaus vorstellbar, dass Personen, ganz gleich welchen Alters, 
die sich der Digitalisierung aktiv oder zufällig entziehen, bspw. sogenannte Off- 
liner (Cachelin, 2015), mit den auf digitale Daten abzielenden Formulierungen 
nichts anfangen können, weil ihnen möglicherweise die Begrifflichkeiten einfach 
unbekannt sind. Auch hier ist allerdings davon auszugehen, dass der Großteil 
der möglichen Befragten aus dieser Gruppe zumindest über allgemeine (Offline-) 
Medienrezeption durchaus mit den Begrifflichkeiten bezüglich der Digitalisierung 
vertraut ist. 

Diese Annahme stützt sich auf aktuelle Umfragen zur Internetnutzung und 
Wahrnehmung der Digitalisierung. Während je nach Quelle im Jahr 2017 zwi- 
schen 81 % (Statista, 2018b) und 89,8 % (Koch & Frees, 2017) der deutschen 
Bevölkerung zu den Internetnutzer*innen zählen, zeigen europaweite Umfra- 
gen zur öffentlichen Meinung zur Digitalisierung, dass sich ein Großteil der 
Bürger*innen ein Urteil über die Auswirkungen der Digitalisierung auf die 
Gesellschaft zutraut (Europäische Kommission, 2010). Gefragt nach ihrer Ein- 
schätzung zum Einfluss digitaler Technologien auf die Wirtschaft geben lediglich 
2 % der befragten Personen in Europa offen zu, nicht genug über digitale Tech- 
nologien zu wissen, um eine Einschätzung geben zu können, und weitere 8 % 
wählen die begründungslose „weiß nicht“-Option. Könnten sich Personen, die 
keine oder kaum persönliche Berührungspunkte mit der Digitalisierung haben, 


4 Та den nachfolgenden Abschnitten wird an den entsprechenden Stellen eine Prüfung auf 
Messinvarianz durchgeführt, die prüft, ob die Messung von unterschiedlichen Gruppen 
gleich verstanden und somit mess-äquivalent ist (Weiber & Mühlhaus, 2014). 
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kein Urteil bilden, müssten eben jene Ausweichkategorien wie „keine Anga- 
be“, „weiß nicht“ und insbesondere das qualifizierte Nicht-Wissen zu digitalen 
Technologien stärker besetzt sein.” 

So zeigen auch aktuelle Umfragen zu KI, einer speziellen datenbasierten Digi- 
talisierungsanwendung (siehe Abschnitt 3.6), der in jüngster Zeit ein großes 
Interesse zukommt, dass sich auch hier ein Großteil der befragten Personen in 
Deutschland Aussagen zutraut: Laut einer Studie von Bitkom aus dem Herbst 
2018 konnten nur 12 % der Befragten überhaupt nichts mit dem Begriff der 
KI anfangen (Bitkom, 2018b). Dies sagt an dieser Stelle noch nichts über die 
tatsächliche Validität der Messungen in den genannten Befragungen aus, son- 
dern dokumentiert lediglich, dass für die BDGS-Skala nicht damit zu rechnen 
ist, dass in Befragungen mit einer heterogenen Zusammensetzung hohe Aus- 
fallquoten (sprich: höher als ca. 10 %) zu erwarten sind. Die Möglichkeit von 
Befragungsartefakten wie Non-Opinions, also das Produzieren von Meinungs- 
artefakten, obwohl keine Meinung oder kein Wissen über das Meinungsobjekt 
vorliegt, bleibt hiervon zunächst einmal unberührt (Bachleitner & Aschauer, 
2008; Brosius et al., 2008). Es wird daher davon ausgegangen, dass der Pool 
der Personen, die mit den Items zu digitalen Daten in Kontakt kommen und hier- 
mit nichts anfangen können, zwar nicht vernachlässigbar, aber doch so gering 
ist, dass das Unterfangen einer allgemeinen Skala zum Glaubenssystem, die in 
der empirischen Sozialforschung eingesetzt werden kann, zunächst einmal nicht 
als aussichtslos erscheint. Allerdings wurde aus Vorsicht in der ersten Erhebung 
noch die Möglichkeit einer „weiß nicht“-Option gegeben. Auf das Ausmaß der 
Wahl dieser Option wird in Abschnitt 9.1.3 eingegangen und dokumentiert, inwie- 
fern die Unmöglichkeit einer Antwort bei einem heterogenen Befragtensample zu 
erwarten ist. 


5 Eine kurze Anmerkung zum zu erwartenden Ausmaß der Non-response-Quote auf ein- 
zelne Befragungsitems: Ferber (1966) berichtet aus einer postalischen Paper-and-Pencil- 
Studie, in der lediglich 37,5 % der Befragten vollständige Antworten gaben, also im 
Umkehrschluss 62,5 % der Befragten mindestens eine Frage nicht beantworteten. Mit Blick 
auf einzelne Items berichtet die Methodenforschung Non-response-Quoten zwischen 2,9 und 
8 % (Craig & Mccann, 1978). Anzumerken ist hierbei, dass in Befragungsstudien zu per- 
sönlich sensiblen Themen wie dem individuellen Gesundheitszustand durchaus hohe Item- 
Nonresponse-Quoten von bis zu 50 % auftreten können (Elliott et al., 2005). Auf dieser 
Grundlage erscheinen Item-Nonresponse-Quoten von ca. 10 % durchaus üblich und las- 
sen demnach nicht erwarten, verzerrte oder nicht aussagekräftige Erkenntnisse bezüglich 
Digitalisierungs-Prädispositionen in der Bevölkerung zu produzieren. 
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8.4.4 Der Einfluss der Sprachbeherrschung der Zielgruppe 
auf die Testkonstruktion 


Die Einschränkung auf die deutschsprachige Bevölkerung in Deutschland exklu- 
diert naturgemäß nicht-deutschsprachige Personen. Nur so kann allerdings sicher- 
gestellt werden, dass ein breites umfassendes Verständnis der Fragen zu einem 
techniknahen Phänomen besteht. Mithin sollten der Test und seine Fragen so 
konstruiert sein, dass Befragte jedes Sprachniveaus, ab der Ebene der kom- 
petenten Sprachverwendung (mind. Level С1 des Gemeinsamen Europäischen 
Referenzrahmens für Sprachen), den Fragebogen beantworten können. Vor allem 
im Hinblick auf das vorausgesetzte Wissen zu technischen Begriffen sollte 
also sichergestellt sein, dass die verwendete Sprache der Fragen des Tests der 
gesamten Testzielgruppe zugänglich ist. Dies wird ebenfalls u. a. durch den 
Einführungstext sichergestellt. 

Die Beschränkung auf Deutsch als einziger Sprache, in der der Test zur 
Messung des BDGS in der vorliegenden Arbeit konzipiert wurde, schließt eine 
nachfolgende Übersetzung des Tests nicht aus. Allerdings müssen hier sprachliche 
und kulturelle Unterschiede in den zu untersuchenden Populationen berücksich- 
tigt werden, um sicherzustellen, dass Äquivalenz und Messinvarianz bei der 
Erhebung des Konstrukts gegeben sind (Hatlevik et al., 2017; Steinmetz et al., 
2009). Es bestehen dann auch durchaus strenge Ansprüche an die Entwicklung 
und Validierung einer Messung, die für komparative Forschung herangezogen 
werden kann und die eine einfache Übersetzung und den ungeprüften Einsatz 
der final verwendeten BDGS-Skala unzulässig erscheinen lässt (Harkness, 1998; 
Harkness et al., 2010). 


8.4.5 Item- und Testfairness 


Schwierigkeitsunterschiede einzelner Frageitems zwischen einzelnen Befragten- 
Gruppen können auch auf eine mangelnde Item- und Testfairness eines Tests 
hinweisen, die bestimmte Gruppen systematisch benachteiligt, bspw. durch 
schwer erkennbare Schriftgrößen für ältere Befragungsteilnehmer*innen (Bühner, 
2011; Kühn & Porst, 1999). Auch hier sollte mangelnde Testfairness dadurch 
verhindert werden, dass mit einem standardisierten und somit für alle Befrag- 
tengruppen gleich zugänglichen Fragebogendesign sowie allgemein verständlich 
formuliert über die Glaubensüberzeugungen bezüglich großer digitaler Daten- 
mengen befragt wird und Frageinhalt und Frageformulierung es allen Befragten 
ermöglichen, ihre persönliche Einschätzung abzugeben. Eine Bevorzugung oder 
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Benachteiligung durch die Vertrautheit mit ähnlichen Tests oder den Einfluss kul- 
tureller Zugehörigkeit sollte durch die Verwendung eines standardisierten Tests, 
der Q-Daten (d. h. Selbst- oder Fremdratings) mit allgemeinverständlicher For- 
mulierung erhebt und sich auf die Zielgruppe der deutschsprachigen Bevölkerung 
beschränkt, vermieden sein. 

Mithin wurde bei der folgenden Itemerstellung berücksichtigt, dass Format, 
Formulierung und Schwierigkeit des zu konzipierenden Tests weder einzelne 
Befragte noch ganze Teilgruppen der Zielgruppe systematisch benachteiligen. 
Da die Befragungsstudien in dieser Arbeit durchweg mit Hilfe der Fragebogen- 
Software SoSci Survey® auf digitalen Computermedien durchgeführt wurden, 
waren so gut wie alle Fragebögen und die Fragebogenseite mit der BDGS-Skala 
barrierefrei zugänglich. So konnten auch Personen mit eingeschränktem Sehver- 
mögen problemlos teilnehmen (bspw. durch Verwendung eines ScreenReaders). 


8.4.6 Die Wahl der Antwortdimensionen der BDGS-Skala 


Neben Einflüssen auf die Beantwortung der Frageitems einer Skala, die durch 
spezielle Eigenschaften der Zielgruppe bedingt sein können, müssen auch 
allgemeine von der Zielgruppe unabhängige Entscheidungen bezüglich der Item- 
formulierung und insbesondere auch der Skalierung bei der Skalenkonstruktion 
berücksichtigt werden. Die gewählte Skala wird im Sinne der vorgeschlagenen 
Ratingskala von Likert (1932) erhoben, so dass mehrere Aussagen (im Folgenden 
auch Items genannt) als Indikatoren einer Dimension dienen. Die Antwortdimen- 
sionen der Skalen sollen den Grad der Zustimmung zu den Aussagen über das 
Wesen digitaler Daten und ihrer Speicherung und Auswertung abbilden, weshalb 
der „Grad der Zustimmung“ (Faulbaum et al., 2009, S. 23) in der vorliegenden 
Arbeit durch eine Zustimmungsskala abgefragt wird. Die Aussagen, im Fol- 
genden auch Glaubenssätze genannt, sind keine Fragen im eigentlichen Sinne, 
sondern als Aussagesätze formuliert. Als Antwort auf die vermeintlichen Fra- 
gen ist dann der explizite Zustimmungsgrad der Aussage zu werten, die von 
den Befragten erbeten wird. Die Zustimmung (ab hier immer auch gedacht als 
mögliche Nicht-Zustimmung) kann dann auf einer mehrstufigen Skala je nach 
Ausprägungsintensität abgestuft werden. Diese Stufen werden als Skalenpunkte 
bezeichnet. Es ist mit Blick auf die Skalenpunkte u. a. zu entscheiden, ob (a) die 
Skalierung gerade oder ungerade ausfallen soll, (b) auf wie vielen Skalenpunkten 


6 Die browserbasierte Befragungssoftware steht für nicht-kommerzielle Studien im wissen- 
schaftlichen Kontext kostenlos zur Verfügung (D. J. Leiner, 2019a). 
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die Befragten ihre Antworten abstufen können und (c) ob und wie die einzelnen 
Skalenpunkte benannt werden. 


Die Entscheidung für eine gerade oder ungerade Skalierung 

Bei einer ungeraden Anzahl an Skalenpunkten gibt es eine Mischkategorie, bei 
der man einen Übergang zwischen Zustimmung und Nicht-Zustimmung hat. Dies 
erleichtert vor allem unsicheren Befragten die Beantwortung und lässt Ambi- 
valenz zu, führt allerdings auch häufig dazu, dass der Skalenmittelpunkt als 
eben jene Ausweichkategorie gesehen wird, die er eigentlich gar nicht darstellen 
soll. Zudem gibt es bei Befragten eine gut dokumentierte ‚Tendenz zur Mitte‘ 
(Menold & Bogner, 2014). Es würden dann Personen, die eigentlich überhaupt 
keine Zustimmung zur Aussage geben können, mit jenen zusammengeworfen, die 
zwar eine Antwort geben können, jedoch zwischen Zustimmung und Ablehnung 
unentschieden sind und gute Argumente für beide Positionen haben. Die Item- 
formulierungen werden unter Verwendung von Ausweichmöglichkeiten, seien es 
Skalenmittelpunkte bei ungeraden Skalenpunkten oder eine „weiß nicht“-Option, 
möglicherweise nicht in der beabsichtigten Bearbeitungstiefe verarbeitet, da sich 
Befragte eben auf ihre Unentschiedenheit zurückziehen. Dieses Phänomen ist 
auch als Satisficing bekannt, eine Strategie der Befragten, um sich kognitive 
Arbeit bei der Beantwortung von Fragen zu ersparen (Krosnick, 1991; Krosnick 
et al., 1996; Krosnick et al., 2001). Bei gerader Anzahl an Skalenpunkten sind 
die Befragten hingegen gezwungen, sich zu entscheiden. Diese Festlegung könnte 
zum einen dazu führen, dass Befragte verunsichert werden können, sie insgesamt 
länger nachdenken und sich somit die Bearbeitungszeit verlängert. Dies in Kom- 
bination mit möglicher Reaktanz könnte schneller zu einer Ermüdung führen und 
die Abbruchquote erhöhen. 

Unter Berücksichtigung des angesprochenen Für und Wider bei der Wahl zwi- 
schen einer geraden oder ungeraden Skalierung wurde sich für eine ungerade 
Skalierung entschieden, da vermeintliche Probleme wie Reaktanz und Verzö- 
gerung bei der Bearbeitung schwerer wiegen als die Tendenz zur Mitte sowie 
Satisficing und auch eher dazu führen könnten, auf die weitere Beantwor- 
tung in einer Befragungsstudie auszustrahlen, in der die BDGS eingesetzt wird. 
Eine finale Klärung der Frage nach der präferierten Art der Skalierung ist hier 
entsprechender Methodenforschung vorbehalten. 
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Die Entscheidung über die Anzahl der Skalenpunkte, Skalenpolung und 
-orientierung 

Ein Blick in die Methodenliteratur zur Befragungsforschung offenbart etli- 
che unterschiedliche Empfehlungen zur Anzahl und visuellen Ausrichtung der 
Skalenpunkte (Faulbaum et al., 2009, S. 65-66; Menold & Bogner, 2014; 
Scholl, 2018, S. 167 ff.). Eine Skalierung mit sieben Skalenpunkten scheint 
im vorliegenden Falle sinnvoll, da dies mit Verweis auf die Erkenntnisse der 
Methodenforschung zur Befragung eine ausreichend hohe Reliabilität gewährleis- 
tet (Alwin & Krosnick, 1991; Groves et al., 2011). Die einzelnen Skalenpunkte 
werden im vorliegenden Fall von links nach rechts von Nicht-Zustimmung zu 
Zustimmung abgestuft, so dass bei der Zuweisung der numerischen Werte für die 
Datenanalyse eine 1 für Nicht-Zustimmung der Aussage steht und mit Zwischen- 
schritten in ganzen Zahlen hin zu 7 verläuft, was für vollkommene Zustimmung 
steht. Die Skala ist somit unipolar und die Skalenorientierung verläuft von links 
nach rechts. Während es zu diesen Entscheidungen laut Menold und Bogner 
(2014) keine klaren Empfehlungen gibt, wurden die dokumentierten Entschei- 
dungen hier entsprechend getroffen, um einen einheitlichen und weitgehend 
standardisierten Skalenaufbau zu gewährleisten. 


Die Entscheidung über die Benennung der Skalenpunkte durch adverbiale Modifi- 
kationen 

Zudem wird die Zustimmung durch adverbiale Modifikationen abgestuft, wobei 
alle Skalenpunkte und nicht nur die Skalenendpunkte beschriftet werden (Faul- 
baum et al., 2009). Es wurde zwar zunächst beabsichtigt, nur die Skalenendpunkte 
zu beschriften, nach einem Hinweis aus einem persönlichen Interview des Pre- 
Tests (siehe Abschnitt 8.5.3) wurde die vollständige Beschriftung der Skala 
beschlossen. In der Literatur der Methodenforschung finden sich auch hierzu 
Empfehlungen: Laut Krosnick (1999) können hierdurch die Reliabilität und 
Validität der Beantwortung erhöht werden. So kommen auch Weijters et al. 
(2010) zu dem Schluss, dass für die Skalenentwicklung vollständig beschriftete 
Skalenpunkte verwendet werden sollten. Dies kann zudem zu einer höhe- 
ren Befragtenzufriedenheit führen (Dickinson & Zellinger, 1980), Ambiguität 
reduzieren und die Test-Retest-Reliabilität verbessern (Weng, 2004). 

Mithin wird für den Skalenpunkt 1 die Antwort „stimme überhaupt nicht 
zu“ und für den Skalenpunkt 7 die Antwort „stimme voll und ganz zu“ verge- 
ben, so dass die Valenz der Skalierung mit aufsteigender Zustimmung von links 
nach rechts verläuft. Der Skalenmittelpunkt, also Punkt 4 wurde mit „Teils/teils“ 
beschriftet, um Ambivalenz zu signalisieren (Menold & Bogner, 2014). Die zur 
Nicht-Zustimmung tendierenden Zwischenpunkte auf der Skala werden für Punkt 
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2 mit „stimme größtenteils nicht zu“ und Punkt 3 mit „stimme eher nicht zu“ 
beschriftet. Die zustimmenden Zwischenpunkte auf der Skala werden für Punkt 
5 mit „stimme eher zu“ und Punkt 6 mit „stimme größtenteils zu“ beschriftet. 
Damit der Skalenmittelpunkt von den Befragten nicht als Fluchtkategorie ver- 
wendet wird, besteht in der ersten Erhebung für die Befragten die Möglichkeit, 
durch die Antwortoption „Kann ich nicht beantworten“ anzuzeigen, dass das Item 
eben nicht beantwortet werden kann. Dies könnte dann ein Hinweis auf Formu- 
lierungsprobleme und die Beantwortungsschwierigkeit sein und wurde bei der 
Auswahl der finalen Items berücksichtigt. 

Die Zuweisung der numerischen Werte erfolgte lediglich für die Auswer- 
tung. Den Befragten selbst wurden keine numerischen Werte für die jeweiligen 
Skalenpunkte angezeigt, da es bei ihnen hierdurch zu unbeabsichtigten Interpre- 
tationsprozessen bezüglich der Wertigkeiten der einzelnen Skalenpunkte kommen 
kann, was vermieden werden sollte (Krosnick, 1999; Schwarz et al., 1991). 


8.4.7 Einleitungstext 


Wie bereits zuvor erwähnt, soll an dieser Stelle mit Blick auf mögliche Verständ- 
nisschwierigkeiten des Befragungsgegenstandes Big Data auf den Einleitungstext 
des konzipierten Tests eingegangen werden. Die Fragenbatterie der BDGS-Skala 
wurde in allen Erhebungen mit diesem Einleitungstext eingeführt, um ein Grund- 
verständnis bei allen Befragten über das herzustellen, was in der Einleitung und 
den Frageitems als ‚Digitale Daten‘ beschrieben wurde. Mit Hilfe interner Dis- 
kussionen am Arbeitsbereich von Prof. Dr. Marcinkowski samt Kollegen (siehe 
nachfolgend Abschnitt 8.5.2) und persönlicher Interviews mit der Methode des 
lauten Denkens, die genutzt wurden, um die Verständlichkeit der Frageitems für 
die erste Erhebung zu prüfen (siehe nachfolgend Abschnitt 8.5.3), wurden all- 
gemeinverständliche Formulierungen und Beispiele gesammelt. Hier sollte ein 
allgemeines Verständnis über den Entstehungs- und Verwendungszusammenhang 
digitaler Daten im Sinne der vorliegenden Untersuchung vermittelt werden. Dabei 
sollte der Einleitungstext so einfach und kurz wie möglich sein und sollten die 
Beispiele allgemein gehalten werden, um die Befragten zwar zu informieren und 
ein einheitliches Verständnis des Gegenstandes herzustellen, zu dem befragt wird, 
eine Beeinflussung jedoch so weit möglich ausschließen. 
Der formulierte Einleitungstext lautete wie folgt: 
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Die zunehmende Verbreitung von digitalen Technologien, wie beispiels- 
weise von Computern und mobilen Endgeräten, im privaten Alltag, 
aber auch in Wirtschaft und öffentlicher Verwaltung führt dazu, dass 
wir alle laufend Datenspuren hinterlassen. Diese können gespeichert, 
miteinander kombiniert und ausgewertet werden. 

Die hieraus entstehenden großen digitalen Datenbestände werden häufig 
auch als Big Data bezeichnet. 


Die Einleitung orientiert sich dabei in Länge, Aufmachung und Inhalt (insbe- 
sondere der Verwendung und Erklärungen von Fachwörtern) an vergleichbaren 
Skalen wie bspw. der Kurzskala Technikbereitschaft von Neyer et al. (2016). 
Der Einleitungstext fand sich auf der jeweiligen Fragebogenseite oberhalb der 
Skala. Die Positionierung sowie Aufmachung kann anhand der Dokumentation 
der Fragebögen im Anhang 3 im elektronischen Zusatzmaterial nachvollzogen 
werden. 


8.5 Vorgehen bei der Itemgenerierung 


Im Folgenden werden die einzelnen Schritte der Skalenkonstruktion beschrieben, 
insbesondere der Erstellung des Itempools, der in einer ersten Befragung auf die 
zugrunde liegende und aus der Literatur abgeleitete Dimensionalität des BDGS 
geprüft werden soll. Auf Grundlage der Definitionen der einzelnen Beschrei- 
bungsdimensionen von Big Data aus der wissenschaftlichen Literatur wurden 
Wörter extrahiert, die Volumen, Vielfalt, Geschwindigkeit, Richtigkeit und den 
Nutzen von Big Data sowie die jeweiligen Subdimensionen beschreiben, wobei 
eine direkte Nennung der Dimensionsbezeichnungen vermieden werden sollte. In 
einem weiteren Schritt wurden daher Synonyme und Umschreibungen zu diesen 
Wörtern gesucht. Eine Übersicht über den entstandenen Wortkorpus findet sich 
in Tabelle 2.A im Anhang im elektronischen Zusatzmaterial. 

Dieser Wortkorpus diente als Vorlage für die Formulierung der Items. Hier- 
bei wurden nicht alle Begriffe auch tatsächlich in Itemformulierungen überführt. 
Gründe hierfür waren bspw., dass einfachere Begriffe bevorzugt wurden oder 
Begriffe mehrdeutig und vermeintlich missverständlich sein konnten. So wurde 
‚korrekt‘ als nicht synonym für Genauigkeit aufgenommen, da das Wort häufig 
wertend verwendet wird („Er ist ein korrekter Typ“). 
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8.5.1 Die notwendige Anzahl der Frageitems 


Es stellt sich bereits bei der ersten Formulierung die Frage, wie viele Items, 
die später als Indikatoren für die Operationalisierung der jeweiligen Dimension 
eingesetzt werden, denn nun tatsächlich gebraucht werden und wie viele Items 
man nun für den ersten Schritt der Skalenkonstruktion vorsorglich formulieren 
müsse. Insbesondere im Rahmen des datenanalytischen Auswertungsverfahrens 
der konfirmatorischen Faktorenanalyse (,Confirmatory Factor Analysis‘ — kurz: 
CFA) gilt zu bedenken, dass für die Identifikation der geschätzten Lösung eines 
reflektiven Messmodells eine ausreichende Anzahl von Indikatorvariablen in die 
Modelspezifikation eingehen muss: 


A common question about CFA concerns a minimum number of indicators per fac- 
tor. In general, the absolute minimum for CFA models with two or more factors is two 
indicators per factor, which is required for identification. However, CFA models — and 
SR [Structural Regression] models, too — with factors that have only two indicators 
are more prone to problems in the analysis, especially in small samples. Also, it may 
be difficult to estimate measurement error correlation for factors with only two indi- 
cators, which can result in a specification error. Kenny’s (1979) rule of thumb about 
the number of indicators is apropos: “Two might be fine, three is better, four is best, 
and anything more is gravy’ (р. 143; emphasis in original). (Kline, 2011, S. 114-115) 


Auch Weiber und Mühlhaus (2014) greifen die Diskussion um die Anzahl auszu- 
wählender Indikatoren auf und empfehlen „bei Mehr-Konstrukt-Modellen reflek- 
tive Konstrukte mindestens mit jeweils zwei Indikatoren zu messen“ (S. 113). 
Diese Minimalanforderung scheint jedoch mit Blick auf erstmalige Testkonstruk- 
tion und den erwogenen Einsatz einer BDGS-Skala in diversen Forschungspro- 
jekten mit unterschiedlichen Stichprobenzusammensetzungen und -größen als zu 
gering. Insbesondere bei kleineren Stichproben (bspw. in Experimentalstudien) 
empfehlen Marsh et al. (1998) eine größere Anzahl an Indikatoren, wobei ihrer 
Ansicht nach mehr Indikatoren generell besser sind als weniger Indikatoren. 
Gleichzeitig muss bedacht werden, dass eine große Anzahl von formal identi- 
schen Likert-Skalen von den Befragten als monoton wahrgenommen wird, die zu 
konstruierende Skala also nicht zu lang werden darf (Petersen, 2014; Ring, 1976). 
Nach Abwägung der Argumente wurde entschieden, mindestens drei Indikatoren 
zur Messung der jeweiligen Dimension des BDGS anzustreben. 

Es muss an dieser Stelle jedoch nicht nur die final gewünschte Anzahl an Indi- 
katoren pro Faktor bedacht werden, sondern auch, wie viele Items zunächst für 
einen ersten Aufschlag zur Testkonzeption vorbereitet werden, die dann womög- 
lich aufgrund mangelnder Messgüte wieder eliminiert werden. Sowohl hier am 
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Beginn der Testkonstruktion als auch mit Blick auf den letztendlichen Einsatz 
des Tests zur BDGS ist daher zwischen einer notwendigen Anzahl von Indika- 
toren für die jeweilige zu messende Dimension und der gebotenen Sparsamkeit 
bei der Fragebogenlänge abzuwägen. Hierbei muss neben Rücksicht auf die Kon- 
zentrationsfähigkeit auch der ‚Respondent Fatigue‘, also der generellen Unlust, 
an Befragungsstudien teilzunehmen (S. R. Porter et al., 2004), durch die Ver- 
wendung möglichst kurzer Skalen entgegengewirkt werden. Es erschien daher 
sinnvoll, mindestens drei Items für die jeweiligen Subdimensionen zu formu- 
lieren, um sowohl zumindest die Unterscheidungsfähigkeit der Subdimensionen 
Entstehung, Speicherung und Auswertung zu prüfen (siehe Seite 93) als auch die 
Möglichkeit zuzulassen, ggf. unpassende Items zu eliminieren, weshalb immer 
mindestens vier, vereinzelt jedoch auch acht Items formuliert wurden. 


8.5.2 Diskussion der Items mit Fachkollegen 


Der so entstandene Itempool wurde zusammen mit zwei Wissenschaftlern mit 
langjähriger Erfahrung mit empirischer Sozialforschung und insbesondere Befra- 
gungsstudien in einem gemeinsamen Workshop am 23. August 2017 diskutiert.’ 
Die dort gemachten Anmerkungen zum besprochenen Itempool wurden auf- 
gegriffen und der Itempool wurde erneut überarbeitet. Folgende Aspekte und 
Anmerkungen waren die Grundlage der Überarbeitung: 


e Formulierungen wurden aus der Perspektive eines normalen Nutzers auf 
Verständlichkeit geprüft und ggf. entsprechend vereinfacht. 

e Es wurde diskutiert, inwieweit jedes einer Dimension zugewiesene Item als 
repräsentativ für die Dimension gewertet werden könnte. 

e Items, deren Formulierung einander zu sehr ähnelten, wurden gestrichen. 


Im Anschluss an diese Überarbeitung der Frageformulierungen fanden sich 82 
Frageitems im Itempool für die BDGS-Skala. 


7 An dieser Stelle möchte ich Herrn Christopher Starke und Pero Do$enovi£ für ihre hilfrei- 
chen Anmerkungen danken. 


8.5 Vorgehen bei der Itemgenerierung 117 


8.5.3 Befragung von typischen Nutzer*innen digitaler 
Medien mittels der Methode des lauten Denkens 


In einem weiteren Schritt wurden, wie in der Literatur vorgeschlagen, persönliche 
Interviews mit einfachen Nutzer*innen digitaler Medientechnik mit dem Ansatz 
des lauten Denkens durchgeführt, um die 82 Items auf Verständlichkeit zu prüfen 
und mögliche Probleme bei der Beantwortung der Items zu identifizieren (Prü- 
fer & Rexroth, 2000, 2005). Beim lauten Denken „werden Personen aufgefordert, 
ihre Gedanken laut auszusprechen, während sie sich einer Aufgabe oder Tätigkeit 
widmen“ (Bilandzic, 2017, S. 406). 

Insgesamt wurden im Zeitraum zwischen dem 30. August und dem 6. Septem- 
ber 2017 sechs Interviews geführt. Bei der Rekrutierung der Gesprächsteilnehmer 
lag der Fokus insbesondere auf Internetnutzer*innen, die auf eine gewisse 
Online-Erfahrung zurückblicken konnten und ein Grundverständnis der Begriffe 
‚Digitalisierung‘ und ‚digitale Daten‘ mitbrachten, da ihnen an dieser Stelle 
noch kein standardisierter Einleitungstext vorgelegt wurde. In Tabelle 2.B im 
Anhang im elektronischen Zusatzmaterial finden sich Informationen zu den per- 
sönlichen Angaben der Personen und der Interviewlänge. Insgesamt wurde in 
jedem Interview aus Zeitgründen lediglich ein Drittel der Items vorgelegt, so 
dass jeweils zwei Interviewte annähernd die gleichen Aussagen evaluiert haben.® 
Zu diesem Zweck wurden die Items vor dem ersten Interview randomisiert, 
um zu gewährleisten, dass nicht nur Items aus einer bestimmten Dimension 
besprochen, sondern von allen Befragten möglichst viele Aussagen aus jeder der 
vorgeschlagenen Dimensionen eingeschätzt wurden. 

Die Gespräche wurden mit Hilfe eines Tonbandgeräts aufgezeichnet. Zudem 
wurden handschriftliche Notizen zu den jeweiligen Items gemacht, die die 
Anmerkungen der Interviewten dokumentierten. Darüber hinaus wurde langes 
Zögern bei der Beantwortung einzelner Items notiert, um festzuhalten, welche 
Items möglicherweise problematisch sein könnten. Die ursprünglich formulierten 
Items wurden auf Grundlage der Interviews überarbeitet und angepasst. Folgende 
Anmerkungen waren die Grundlage der Überarbeitung: 


e Missverständliche Items wurden verständlicher formuliert. 
® Items, deren Formulierung als identisch wahrgenommen wurde, wurden 
gestrichen oder angepasst. 


8 Aufgrund direkter Überarbeitung von missverständlichen und fehlerhaften Items, die im 
Anschluss an jedes Interview stattfanden, wichen auch die jeweils gleichen vorgestellten 
Itemlisten in Teilen voneinander ab. 
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Insgesamt ergab sich mit Blick auf die vorgelegten Itemlisten, dass die Items ins- 
gesamt als verständlich und erfolgreich zu beantworten wahrgenommen wurden. 
Es zeigten sich bei den verwendeten Ausdrücken keinerlei Schwierigkeiten für die 
Beantwortung, so dass nach Streichung als identisch wahrgenommener Items 69 
Frageitems vorlagen. Auch eine Verortung auf der geplanten 7-Punkt-Likert-Skala 
konnte von allen Interviewten für die Items vorgenommen werden. 


8.5.4 Zusammensetzung der Frageitems für die erste 
Erhebung 


Alle 69 Frageitems sowie deren Zuordnung zu den einzelnen Dimensionen fin- 
den sich in Tabelle 2.C im Anhang im elektronischen Zusatzmaterial. Für die 
Dimensionen der Bewertung des Volumens, der Geschwindigkeit und der Vielfalt 
fanden sich letztendlich jeweils zwölf Frageitems. Bei der Formulierung der Items 
wurde zunächst der Idee gefolgt, man könne mit Blick auf den Entstehungs- und 
Verwertungskontext der Daten bei diesen Dimensionen noch zwischen Entste- 
hung, Speicherung und Auswertung der Daten differenzieren. Die Formulierung 
der Frageitems greift daher diese Aufteilung in den genannten Dimensionen auf, 
so dass sich jeweils zwei bzw. drei hierauf abzielende Items finden. Da diese 
Frageitems (wie auf S. 94 besprochen) nicht zentral für die nachfolgende Aus- 
wertung sind, finden sich weitere Informationen hierzu im Anhang Abschnitt 1.1 
im elektronischen Zusatzmaterial. 

Für die Dimension Richtigkeit der Daten fanden sich 18 Frageitems, von 
denen jeweils sechs Frageitems die spezifischen Charakteristika der Genauig- 
keit, des Wissensgewinns sowie der Wahrhaftigkeit und der Objektivität betrafen. 
Für den Nutzen der digitalen Daten fanden sich insgesamt 15 Items, wobei sie- 
ben Items den individuellen Nutzen und acht Items den gesellschaftlichen Nutzen 
adressierten. 
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Studie 1 - Durchfiihrung der © 
Skalenkonstruktion 


Im Folgenden wird die Durchführung der Online-Befragungen der ersten Stu- 
die zur Skalenkonstruktion dokumentiert. In diesem Rahmen wurden drei Erhe- 
bungen durchgeführt, die nachfolgend als Erhebung 1.1, 1.2 und 1.3 bezeichnet 
werden. Die erste Erhebung 1.1 diente der Identifikation geeigneter Frageitems 
und der Prüfung der zugrunde liegenden Modellstruktur, die Erhebungen 1.2. 
und 1.3 der Validierung der in Erhebung 1.1 ermittelten Modellstruktur. Dabei 
wird zunächst am Beispiel der Erhebung 1.1 detailliert auf den Aufbau und 
den empirischen Einsatz der Skala in der Befragung eingegangen. Zudem wer- 
den einmal ganz allgemein die Auswertungsschritte der Datenanalyse mittels 
Strukturgleichungsmodellierung nachvollziehbar begründet und dargelegt. 


9.1 Erhebung 1.1 der 
Skalenkonstruktion - Identifikation geeigneter 
Frageitems und Prüfung der Modellstruktur 


Ziel dieser Erhebung war die Identifikation geeigneter Frageitems und eine erste 
Prüfung der konzeptuellen Modellstruktur. Nachdem die entwickelten Items die 


l Alle Fragebögen der berichteten Studien im Rahmen dieser Arbeit wurden mit der 
Befragungssoftware des Anbieters SoSci Survey GmbH programmiert (D. J. Leiner, 
2019a). Weitere Informationen unter und https://www.soscisurvey.de/ [zuletzt zugegriffen 
am 25.04.2020]. 


Ergänzende Information Die elektronische Version dieses Kapitels enthält 
Zusatzmaterial, auf das über folgenden Link zugegriffen werden kann 
https://doi.org/10.1007/978-3-658-36368-0_9. 
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Experten- und Nutzerinterviews durchlaufen hatten und der Fragepool angepasst 
und überarbeitet wurde, wurden die Items mit Hilfe der Fragebogensoftware 
SoSci Survey! für die Erhebung 1.1 in einen Online-Fragebogen überführt. 


9.1.1 Aufbau des Fragebogens 


Der Aufbau des Fragebogens sah vor, dass die Befragten zunächst begrüßt und 
über das Thema und die ungefähre Zielsetzung der Befragung aufgeklärt wur- 
den. Die Befragten wurden eingeladen an einer „Umfrage zur Wahrnehmung 
und Bewertung der Digitalisierung der Gesellschaft“ teilzunehmen, deren Beant- 
wortung ca. 15 Minuten in Anspruch nehmen sollte. Anschließend folgten die 
Fragen zur Soziodemografie der Befragten (Alter, Geschlecht, Bildungsniveau 
und Berufstätigkeit), die zur Quotierung genutzt wurden. 

Es folgte dann das Briefing für die Items der Skalenkonstruktion. Ziel des 
Briefings war es, den Befragten die Zielsetzung und den Befragungsgegenstand 
zu verdeutlichen, weshalb der mit dem Ausfüllen verbundene Auftrag zusammen 
mit dem Einleitungstext (siehe Abschnitt 8.4.7) vorgestellt wurde. Das Briefing 
lautete wie folgt (Hervorhebungen wie im Fragebogen): 


Der Gegenstand dieser Studie: die Digitalisierung der Gesellschaft 

Die zunehmende Verbreitung von digitalen Technologien wie beispielsweise 
von Computern und mobilen Endgeräten im privaten Alltag, aber auch in Wirt- 
schaft und öffentlicher Verwaltung führt dazu, dass wir alle laufend Datenspu- 
ren hinterlassen, die gespeichert, miteinander kombiniert und ausgewertet wer- 
den können. Die hieraus entstehenden großen digitalen Datenbestände werden 
häufig auch als Big Data bezeichnet. 

Im Folgenden möchten wir Sie zu Ihrer persönlichen Einschätzung zu Ent- 
stehung und Verwendung dieser digitalen Datenbestände befragen. Hierbei 
gibt es weder falsche noch richtige Antworten, uns interessiert Ihre ganz 
individuelle Meinung. 

Bitte lesen Sie daher die folgenden Aussagen aufmerksam durch und beant- 
worten Sie ehrlich und spontan, inwieweit Sie den Aussagen zustimmen. 
Einige der folgenden Aussagen mögen Ihnen dabei recht ähnlich vorkommen. 
Dies ist allerdings beabsichtigt und hilft uns Ihre Einschätzungen insgesamt 
besser zu verstehen, da im Rahmen dieser Studie ein neues Erhebungsinstru- 
ment entwickelt werden soll. 
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Der Fragebogen umfasste 93 Items zur Wahrnehmung digitaler Daten und bein- 
haltete die 69 zugehörigen Items der Beschreibungsdimensionen von Big Data 
sowie eine Subskala zu Technological Solutionism (TS — Morozov, 2014). 
Die insgesamt 69 Items der BDGS-Skala wurden zusammen mit den TS-Items 
randomisiert und in Frageblöcke zu jeweils zehn Items aufgeteilt. Um die 
Beantwortung der Frageitems nicht zu eintönig werden zu lassen und Ermüdungs- 
effekten vorzubeugen, wurde nach etwas mehr als der Hälfte der Fragen eine 
Fragebatterie mit sechs Items zur Nutzung politischer Informationen im Internet 
während des zum Zeitpunkt der Befragung aktuell laufenden Bundestagswahl- 
kampfs in Deutschland eingeschoben. Dieser Fragenblock hatte keinen Einfluss 
auf die Reihenfolge der Randomisierung, so dass jedes Item sowohl zufällig vor 
oder nach dieser Itembatterie angezeigt werden konnte. 

Die Rekrutierung für einen Pre-Test des Fragebogens fand über Facebook statt, 
indem Freunde und Bekannte auf die Befragung hingewiesen wurden. Insgesamt 
haben 16 Personen den Fragebogen vollständig beantwortet, die im Durchschnitt 
11,23 Minuten (SD = 3,45) für die Beantwortung der Fragen brauchten. Es 
konnten keine Probleme bei der Befragung festgestellt werden. Am Ende des Pre- 
Test-Fragebogens bestand noch die Möglichkeit für die Befragten, Kommentare 
zum Fragebogen zu hinterlassen. Einige wenige Kommentare bezogen sich ledig- 
lich auf die Länge und Eintönigkeit der Fragebatterien und deren Formulierungen. 
Nachdem der Online-Fragebogen und die Items der zu konstruierenden Skala 
die vorgehend ausführlich beschriebene Testphase durchlaufen hatten, konnte der 
finale Fragebogen ins Feld gehen. Der finale Fragebogen findet sich im Anhang 
3.1 im elektronischen Zusatzmaterial. 


9.1.2 Feldphase, Datenbereinigung und finale Stichprobe 


Die Feldphase der Befragung lief vom 18. bis zum 26. September 2017. Die 
Rekrutierung der Befragten erfolgte durch die Respondi AG, die hierzu auf ihr 


2 In Erhebung 1.1 wurden noch Frageitems aufgenommen, die speziell auf eine Problemlö- 
sung durch digitale Daten abzielten und inspiriert waren von Morozovs (2014) Konzept des 
Technological Solutionism (TS). Die 24 Frageitems für TS zielten auf zwei Subdimensio- 
nen ab, wobei zwölf Items eine individuelle Problemlösung durch digitale Daten betrafen 
und zwölf Items auf eine gesamtgesellschaftliche Problemlösung abstellten. Diese Items und 
die Prüfung ihrer Dimensionierung werden mit Rücksicht auf den Umfang der vorliegenden 
Arbeit nicht weiter besprochen. Da sie jedoch in der ersten Befragung einen gewissen Teil 
des Fragebogens einnahmen und daher auch aus Gründen der Vollständigkeit in der Item- 
liste in der Tabelle 2.C. im Anhang im elektronischen Zusatzmaterial aufgeführt sind, wird 
an dieser Stelle kurz auf sie hingewiesen. 
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Online-Access-Panel zugriff, das durch die international gültige Norm ISO 26362 
zertifiziert ist.” 


Auswahllogik der Stichprobe der ersten Befragung der Skalenkonstruktion 

Um ein möglichst ausgeglichenes Sample für die erste Erhebung der Skalenkon- 
struktion zu erhalten, wurde bei der Rekrutierung eine Quotierung vorgesehen und 
mit dem Panelanbieter vereinbart. Das Geschlechterverhältnis sollte ausgeglichen 
sein. Zudem sollten annähernd gleich viele Befragte mit hohem und niedrigem 
bis mittlerem Bildungsniveau rekrutiert werden. Auch im Hinblick auf das Alter 
sollten zum einen Befragte ins Sample gelangen, die zu den sogenannten Digital 
Natives gehören (Prensky, 2001), also zu den Personen zählen, die bereits in einer 
frühen Lebensphase mit digitalen Medien sozialisiert wurden. Zum anderen sollte 
eine annähernd gleich große Gruppe von Personen am Fragebogen teilnehmen, 
die erst in einer späteren Lebensphase regelmäßigen Kontakt mit digitalen Medien 
hatte und noch Zeiten erlebt hat, in denen es noch keine hohe gesellschaftliche 
Durchdringung des Internets gab. Hinter diesem Vorgehen stand die Überlegung, 
dass in späteren Befragungseinsätzen der Skala die Population aus allen Online- 
Nutzer*innen der Bundesrepublik Deutschland besteht und somit eine Vielzahl 
an Personen und demografischen Milieus die Skala erfolgreich verstehen und 
beantworten können muss. Dabei gibt es mit Blick auf die Literatur eine reich- 
haltige Diskussion, ob und wie zwischen Digital Natives und Digital Immigrants 
unterschieden werden kann (Helsper & Eynon, 2010; Margaryan et al., 2011). 
Eine entsprechende Aufteilung schien hier ebenfalls geboten sowie möglich. Die 
Unterteilung in Digital Natives und Digital Immigrants für Erhebung 1.1 wurde 
wie folgt vorgenommen: Mit Blick auf Usenet-Gruppen und andere an Privatleute 
gerichtete Online-Angebote, die zu Beginn der 1980er Jahre Verbreitung fanden 
(Hauben & Hauben, 1997), wurden alle Befragte, die 1982 oder später gebo- 
ren wurden, der Gruppe U35 zugewiesen, alle Befragten, die vor 1982 geboren 
wurden der Gruppe U35. 

Es wurden 1568 Einladungen verschickt. Insgesamt wurde der Fragebogen 
374-mal aufgerufen. Mit der Beantwortung begannen 356 Befragte, wovon wie- 
derum 306 Befragte den Fragebogen beendeten und die letzte Fragebogenseite 
erreichten. Die Antwortrate lag somit bei 19,5 %. 


3 Weitere Informationen finden sich unter https://www.respondi.com/access-panel [zuletzt 
zugegriffen am 31. Mai 2019]. 
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Datenbereinigung 

Der vollständige Datensatz mit 306 abgeschlossenen Interviews wurde anschlie- 
Bend bereinigt. Bei dieser Bereinigung wurden zwei Ausschlusskriterien angelegt: 
Zum einen wurde die Beantwortungszeit betrachtet, zum anderen wurde nach 
offensichtlichen Mustern im Antwortverhalten ‚gescreent‘ (sprich: regelgeleitet 
geprüft), wobei der Fokus auf dem sogenannten ‚Durchklicken‘ lag. Das bedeu- 
tet bspw., dass Befragte immer nacheinander weg die gleiche Antwort geben und 
somit keine Varianz im Antwortverhalten besteht oder von ‚links oben nach rechts 
unten‘ klicken, also zwar Varianz entsteht, diese aber keine sinnhafte Bedeutung 
beinhaltet und somit keine tatsächliche Differenzierung ermöglicht. Die ausführ- 
liche Prüfung wird im nachfolgenden Abschnitt dokumentiert. In den weiteren 
berichteten Erhebungen wird diese strenge Prüfung allein aus forschungsökono- 
mischen Gründen nicht in entsprechendem Maße durchzuhalten sein. Zwar wird 
bei jeder durchgeführten Erhebung eine Mindestdauer formuliert, die erreicht 
werden muss, da andernfalls nicht davon ausgegangen werden kann, dass die 
Beantwortung sinnhaft geleistet wurde. Die intensive Prüfung auf Beantwortungs- 
muster jedoch ist (a) zeitintensiv und (b) es gibt kein allgemeingültiges Vorgehen 
bei der Prüfung auf invalide Antwortmuster. Antwortverhalten, das keine Varianz 
aufweist, lässt sich noch verhältnismäßig leicht erkennen und ist eher unwahr- 
scheinlich. Willkürlich erscheinende Antwortmuster sind jedoch schwieriger zu 
erkennen und müssen nicht zwingend invalide sein. Eine Möglichkeit, systema- 
tisch auf sinngemäße und valide Antwort zu prüfen, sind sogenannte ‚Attention 
Checks‘, wie sie in Erhebung 1.3 und 2.1 eingesetzt wurden. Da die erste Erhe- 
bung zur Skalenkonstruktion nur auf ein kleines Sample zurückgreifen konnte 
und insbesondere die Differenzierung zwischen den Dimensionen im Fokus stand, 
wurden hier der erhöhte Aufwand und eine gründliche Plausibilitätsprüfung der 
Daten betrieben. 


Screenout durch zu schnelles Beantworten 

Im Durchschnitt benötigten die Befragten rund 8 Minuten und 47 Sekunden (SD 
= 4 Minuten 27,5 Sekunden). Es wurde vor Durchführung der Befragung mit 
dem finalen Fragebogen getestet, wie lange ein Befragter mindestens brauchen 
würde, um den Fragebogen zu beenden, wenn er oder sie nur die Itemformulie- 
rungen, nicht aber die Begrüßung, Briefing, Einleitungen und Instruktionen lesen 
und zügig beantworten würde. Der durch diesen Test mit mehreren Probetestern 
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ermittelte Wert, zu dem auch die Ergebnisse aus dem Pre-Test herangezogen wur- 
den, lag bei genau 3 Minuten. Es wurden daher alle Befragten, die weniger als 
3 Minuten gebraucht haben und somit mehr als 1,3 Standardabweichungen nach 
unten abwichen, aus dem Datensatz ausgeschlossen. Insgesamt 28 Befragte und 
somit 9,2 % des gesamten Samples benötigten weniger als 3 Minuten für alle 
Fragen und wurden folglich für die Auswertung ausgeschlossen. 


Screenout durch Beantwortung in Antwortmustern 

Um sogenannte Durchklicker zu identifizieren, deren Antwortverhalten sich auf 
fast immer die gleiche Antwort auf alle Frageitems auszeichnet, wurden die Ant- 
worthäufigkeiten über alle 93 Items der Skala zur Wahrnehmung digitaler Daten 
ausgezählt. Da es hier jedoch keine allgemeingültigen Daumenregeln zur Iden- 
tifizierung gibt, wurde recht liberal festgelegt, dass nicht mehr als 90 % der 
Antworten auf den gleichen Skalenpunkt entfallen durften, was ab 83 von 93 
möglichen Antworten der Fall war. Immerhin ist es möglich, dass bestimmte 
Befragte eine Tendenz zur Mitte hatten und durchweg „Teils/teils“ angaben oder 
gar keine Antwort geben konnten und „Kann ich nicht beantworten“ ankreuzten. 
Daher wurden lediglich Befragte ausgeschlossen, die 83 oder mehr gleiche Ant- 
worten gaben, was auf 36 Befragte, also eine ‚Click-Through-Rate‘ von 11,8 % 
des Samples zutraf. 

Da es Befragte gab, die zu beiden Gruppen gehörten, wurden 51 Perso- 
nen aus dem Auswertungsdatensatz ausgeschlossen, so dass von 306 vollständig 
ausgefüllten Fragebögen noch 255 Fragebögen in die Auswertung eingingen. 

Der Tabelle 9.1 kann nicht nur die demografische Zusammensetzung des fina- 
len Samples entnommen werden, sondern sie enthält auch die demografische 
Zusammensetzung der ausgeschlossenen Fälle. 


9.1 Erhebung 1.1 der Skalenkonstruktion - Identifikation geeigneter ... 127 


Tabelle 9.1 Unterschiede in der Soziodemografie zwischen gültigen und ungültigen Fällen 
im Sample der Erhebung 1.1 


Soziodemografische Variable Aufgenommene Fälle Ausgeschlossene Fälle 
absolut relativ absolut relativ 
Geschlecht 
Männlich 128 50.2 % 23 45.1 % 
Weiblich 127 49.8 % 28 54.9 % 
Alter 
Unter 35 Jahren 113 44.3 % 36 70.6 % 
Über 35 Jahren 142 55.7% 15 29.4 % 
Bildung 
Niedrige/mittlere Bildung 112 43.9 % 40 78.4 % 
Hohe Bildung 143 56.1 % 11 21.6 % 
n 255 83.3 % 51 16.6 % 


Hier zeigt sich, dass vor allem jüngere und niedrig bis mittel gebildete 
Befragte den Fragebogen nicht erwartungsgemäß ausgefüllt haben. Dies führt 
zu einer leicht ungleichen Verteilung des finalisierten Samples. 


Finale Stichprobe 

Die finale Stichprobe bestand aus n = 255 Befragten, die den Fragebogen voll- 
ständig beantwortet haben. Dieses Sample setzt sich dabei wie folgt zusammen: 
Männer (n = 128) und Frauen (n = 127) waren fast gleich stark vertreten. Das 
Durchschnittsalter der Befragten lag bei etwas mehr als 43 Jahren (M = 43,1; 
SD = 16,6). Abitur oder einen höheren Abschluss hatten 56,1 % der Befrag- 
ten, einen niedrigeren Bildungsabschluss hatten 43,9 % der Befragten. Obwohl 
die Quotierung den Anspruch hatte, für diese drei Variablen annähernd gleich 
große Gruppen zu rekrutieren, ergab sich wie zuvor dokumentiert durch die 
Datenbereinigung eine leicht unterschiedliche Gruppengröße. Es sind allerdings 
für die konfirmatorische Faktorenanalyse keine nachteiligen Auswirkungen zu 
erwarten, zumal zunächst Items identifiziert werden sollen, die die vermuteten 
Konstruktdimensionen repräsentativ und reliabel abbilden. Es erfolgt keine Aus- 
sage zur Prävalenz der Wahrnehmung digitaler Daten in der Bevölkerung der 
Bundesrepublik. 
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9.1.3 Vorgehen bei der Datenanalyse mittels 
konfirmatorischer Faktorenanalyse durch 
Strukturgleichungsmodellierung 


Im folgenden Abschnitt wird die Datenanalyse ausführlich erörtert, wobei 
zunächst allgemein auf das Vorgehen bei der konfirmatorischen Faktorenanalyse 
(‚Confirmatory Factor Analysis‘ — kurz: CFA) durch Strukturgleichungsmodellie- 
rung eingegangen wird — ein Datenanalyseverfahren, das in allen nachfolgenden 
Erhebungen angewandt wurde und daher an dieser Stelle grundlegend begründet 
und erörtert werden soll. Da die Items der einzelnen Dimensionen auf Grundlage 
der konzeptuellen Modellierung des ersten Teils der Arbeit zum BDGS gezielt als 
manifeste Indikatoren eines zugehörigen latenten Faktors formuliert waren und 
in ihrem Verhältnis zueinander ausgewogen erstellt wurden, gebot es sich, die 
vermutete Modellstruktur direkt durch eine konfirmatorische Faktorenanalyse zu 
prüfen (Bandalos, 2017). Es wurde mithin darauf verzichtet, eine Strukturprüfung 
ohne vorherige Annahmen durchzuführen wie etwa im Rahmen der explorativen 
Faktorenanalyse. 

Die Auswertung der ersten Erhebung zielte darauf ab, die Items zu identifizie- 
ren, die geeignete reflektive Indikatoren sind, die zuvor beschriebenen einzelnen 
Dimensionen abzubilden und zu erheben. In den nachfolgenden Erhebungen 
wurden diese Indikatoren dann wiederholt erhoben und die Modellstruktur 
wurde erneut mittels CFA gepriift. Das datenanalytische Vorgehen unterschei- 
det sich daher zwischen den Erhebungen kaum: Die Auswertungslogik und 
die verwendeten Kennwerte bleiben konstant, lediglich in der ersten Erhebung 
wurde aufgrund der ersten Identifikation geeigneter Indikatoren eine ausfiihrliche 
Modellrespezifikation vorgenommen. 

Für die Datenauswertung der Messmodelle in den insgesamt sieben Erhebun- 
gen wurden konfirmatorische Faktorenanalysen durchgeführt, um die jeweiligen 
reflektiven Messmodelle sowie die Zusammenhänge und die Dimensionalitäts- 
zugehörigkeit der beobachteten Messungen zu prüfen. Ziel der Datenanalyse 
mittels Strukturgleichungsmodellierung ist „die empirische Prüfung der durch 
das Strukturmodell abgebildeten theoretisch vermuteten Zusammenhänge“ (Wei- 
ber & Mühlhaus, 2014, S. 126). Grundannahme der CFA ist, dass das modellierte 
latente Konstrukt — im vorliegenden Fall somit die jeweilige interessierende 
Dimension — als exogene Variable einen Einfluss auf die Beantwortung der 
Fragebogenitems hat, die als Indikatoren fiir die Dimension herangezogen wer- 
den und im jeweiligen Modell als manifeste (d. h. tatsächliche Beobachtungen) 
endogene Variablen aufgenommen werden. Alle nachfolgenden Auswertungen 
zur Prüfung wurden mit den Datenanalyseprogrammen SPSS 23 vorbereitet 
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und mit AMOS 23 (Analysis of Moment Structures) durchgeführt, das einem 
kovarianzanalytischen Ansatz folgt (Weiber & Mühlhaus, 2014). Die Prüfung 
der Messinvarianz wurde aus Gründen der Praktikabilität in Teilen mit dem 
Datenanalyse-Programm R (R Core Team, 2020) und dem Package lavaan durch- 
geführt (Rosseel, 2012). Für alle Analysen wurde die standardmäßig in AMOS 
voreingestellte Maximum-Likelihood-Methode zur Modellschätzung gewählt.* 
Da es jedoch zu fehlenden Daten kam und Modifikationsindizes zur Modell- 
respezifikation herangezogen werden sollten, die jedoch nur für vollständige 
Datensets bereitgestellt werden können, wurden Daten teilweise imputiert. Das 
Vorgehen bei der Modell-Schätzung unter Berücksichtigung der Datenimputation 
wird nachfolgend erläutert. 


Imputation der Daten 

Da es vorkam, dass Befragte nicht alle Items beantworteten oder die „weiß 
nicht“-Option wählten, kam es vor, dass nicht für jeden Fall im Datensatz für 
alle 93 abgefragten Items Daten vorlagen. Für die Identifikation der auszuwäh- 
lenden Items sollte jedoch auf die Modifikationsindizes des Programms AMOS 
zurückgegriffen werden, um Items bzw. deren Fehlervarianzen zu identifizieren, 
die miteinander oder den latenten Faktoren kovariierten, obwohl das die theo- 
retischen Überlegungen und folglich auch das Messmodell nicht vorsehen. Da 
AMOS Modifikationsindizes nur ausgeben kann, wenn vollständige Daten vor- 
liegen und die Schätzung nach der Maximum-Likelihood-Methode durchgeführt 
wird, wurden für die Datenauswertung die fehlenden Daten im Datensatz der 
Erhebung 1.1 mittels der AMOS-Funktion Regression Imputation imputiert. Bei 
der Imputation ist davon auszugehen, dass die fehlenden Daten „missing at ran- 
dom“ (Kline, 2011, S. 55 f.) sind, also fehlende Angaben nicht systematisch 
zustande kommen. Insbesondere für die „weiß nicht“-Antworten kann bei fehlen- 
den Werten nicht davon ausgegangen werden, dass diese „missing completely at 
random‘ sind — eine Annahme, die laut Kline (2011, S. 56) bei realen Datensätzen 
jedoch kaum gegeben sein dürfte und nur schwer zu prüfen ist. Für die Antwor- 
ten, die bewusst keine Angabe auf der 7-Punkt-Likert-Skala enthalten, kann diese 
Annahme des zufälligen Fehlens daher nicht gemacht werden. Sie wird für die 
Imputation jedoch angenommen, um die Modellprüfung mit einem ausreichend 


4 Es wird mithin von einer Normalverteilung der erhobenen Indikatoren ausgegangen. Diese 
Annahme wird nach visueller Inspektion der Verteilungen der Variablen beibehalten, auch 
wenn ein Kolmogorov-Smirnov-Test auf Normalverteilung der Fallzahlen zu einem gegen- 
teiligen Ergebnis kommt. Für eine Übersicht über alternative Modell-Schätzverfahren bei der 
groben Verletzung dieser Annahme siehe die Übersicht von Bandalos (2017, S. 368 ff.). 
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großen Datensatz zu ermöglichen. Insgesamt lagen von 199 Befragten vollstän- 
dige Datensätze vor. Im Schnitt fehlten pro Item rund 3,5 % der Werte, die mittels 
der Regressionsimputation imputiert werden mussten. Lediglich bei zwei Varia- 
blen wurden 18 „weiß nicht“-Antworten gezählt, so dass im Maximalfall knapp 
7 % der Angaben für ein Item fehlten. 

Das finale Modell wurde aufgrund der Imputation der Daten daher auch 
noch einmal mittels der Full-Information-Maximum-Likelihood-Methode (FIML) 
berechnet (siehe Abschnitt 9.1.6), um sich gegen etwaige Probleme abzusichern, 
die durch die Imputation entstanden sein könnten (Kline, 2011). Die erste Spe- 
zifikation sowie die Respezifikationsschritte wurden auf Grundlage des durch 
Imputation neu entstandenen Datensatzes durchgeführt. 


Vorgehen bei der Modellspezifikation und -respezifikation 

Der idealtypische Ablauf der Modellspezifikation und -respezifikation ist in 
Abbildung 9.1 dargestellt. Zunächst wurden alle Frageitems einer Dimension in 
das jeweilige Messmodell eingefügt. Es wurde in allen Messmodellen zur Ska- 
lierung ein Referenzindikator durch ein Unit Loading Identification Constraint 
(ULI; Kline, 2011, $. 127) mit dem Regressionsgewicht = 1 festgelegt.° Bei 
vollständigen Datensätzen (wie bspw. den Modellen auf Grundlage imputierter 
Datensätze) wurden die Modelle ohne Mittelwerte (Means) und Regressionskon- 
stanten (auch als Intercepts bezeichnet) berechnet und es wird an entsprechender 
Stelle gesondert darauf hingewiesen, wenn die Modelle mittels FIML geschätzt 
wurden. 
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Abbildung 9.1 Schritte der Modell-(Re)-Spezifikation 


5 Siehe Items AVO1_44 und АУ01 85 im Anhang 2.1 im elektronischen Zusatzmaterial. 


6 Auch für die Störgrößen in Strukturmodellen und die Messfehler in Messmodellen wurden 
wie üblich ULI Constraints mit dem Regressionsgewicht = 1 festgelegt (Kline, 2011). 
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Um geeignete Fragebogenitems zu identifizieren und ungeeignete Items auszu- 
schließen, wurden drei unterschiedliche Strategien angewendet, die nachfolgend 
allgemein beschrieben werden. Dabei werden im Laufe der jeweiligen Respe- 
zifikationsschritte unzählige kleine und größere Entscheidungen getroffen, die 
hier im Rahmen der Verschriftlichung des Vorgehens nicht alle bis ins Detail 
gelistet und nachvollzogen werden können. Es ist bei der Modellspezifizie- 
rung abzuwägen zwischen größtmöglicher Transparenz und Sparsamkeit in der 
Dokumentation. Anhand des zur Verfügung gestellten Datensatzes und der berich- 
teten Modelle können jedoch jederzeit alternative oder (fast-)aquivalente Modelle 
geprüft werden ((Near-)Equivalent-Models, Kline, 2011). 


Begutachtung der standardisierten Faktorladungen 

Zunächst wurden Items ausgeschlossen, die nur einen geringen Erklärungsbei- 
trag zum jeweiligen latenten Konstrukt lieferten. Dies war der Fall, wenn die 
standardisierten Faktorladungen der gemessenen Variable unter einem Wert von 
.70 lagen, da hier weniger als die Hälfte der Varianz einer Variable durch das 
zugrunde liegende Konstrukt erklärt werden kann. Werte > .70 der standardi- 
sierten Faktorladungen hingegen indizieren Konvergenzvalidität der manifesten 
Indikatoren eines latenten Konstrukts (Kline, 2011). 


Die Verwendung von Modifikationsindizes 

Weiterhin wurden mittels der Modifikationsindizes Items identifiziert, deren Feh- 
lervarianzen miteinander kovariierten (Weiber & Mühlhaus, 2014). Das bedeutet 
konkret, dass diese Items noch durch eine andere zusätzliche latente Variable, 
die nicht im Modell abgebildet war, beeinflusst wurden, die deren gemeinsam 
geteilte Varianz zusätzlich zum zufälligen Messfehler erklären kann. Ist dieser 
Pfad nicht vorhanden, also nicht im Modell abgebildet’ und somit nicht freigege- 
ben, ist die Annahme, dass in vorliegendem Fall keine Beziehung zwischen den 
Fehlervarianzen besteht, weil sich gemeinsame Varianz nur über den modellierten 
latenten Faktor erklären sollte. Hierauf stellen nun die berechneten Modifikations- 
indizes ab: “(...) A modification index estimates the amount by which the overall 
model chi-square statistic, Х?м, would decrease if a particular fixed-to-zero para- 
meter were freely estimated” (Kline, 2011, S. 217). Die Modifikationsindizes 
schlagen dann vor, diesen nicht vorhandenen Pfad in das Modell einzufügen; die 


7 Potentiell mögliche Pfade oder Kovarianzen zwischen Variablen im Modell, die jedoch 
nicht freigegeben oder mit einer Identitätsrestriktion belegt sind, werden bei der Modell- 
schätzung als nicht vorhanden und somit = 0 behandelt. 
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Fehlerterme können frei variieren. Je größer der Modifikationsindex, desto grö- 
Ber die Verringerung des Chi-Quadrat-Wertes und folglich auch die Stärke des 
geschätzten Zusammenhangs. Dabei ist zu berücksichtigen, dass dieser Weg der 
Respezifikation rein empirisch begründet wird und laut Kline (2011) anfällig für 
statistische Fehlentscheidungen, genauer den Alpha- und Beta-Fehler, ist. Es wird 
daher nicht empfohlen, die Fehlerterme eines Messmodells miteinander kovariie- 
ren zulassen. Dies ist auch messtheoretisch nicht gerechtfertigt, da mit Blick auf 
die Konzeption des Messmodells von der Uni-Dimensionalität der Indikatoren 
ausgegangen wird (Hermida, 2015). 


Zusätzliche dimensionale Einflüsse am Beispiel begrifflicher Ähnlichkeit 
Um den Einfluss dieser zusätzlichen, jedoch unberücksichtigten und nicht zu 
identifizierenden latenten Variable(n) auszuschließen, wurden die entsprechenden 
Items aus dem Modell entfernt. Dass bedeutet nicht, dass sie keinen Erklä- 
rungsbeitrag für die jeweils abgebildete Dimension lieferten, sondern, dass es 
vermutlich noch einen anderen nicht zu identifizierenden Einfluss gab, der die 
Beantwortung durch die Befragten beeinflusste. Nun kann zum einen davon aus- 
gegangen werden, dass möglicherweise ein nicht beabsichtigtes Konstrukt einen 
Einfluss auf die Beantwortung der in Frage kommenden Variablen hat, die mit- 
einander über das eigentlich zu messende Konstrukt hinaus kovariieren. Es lässt 
sich nur vermuten, welche zusätzlichen Einflüsse es auf das Antwortverhalten 
gab. Allerdings kann aufgrund der auffallend häufig vorkommenden unerklärten 
gemeinsamen Varianz zweier sich in ihrer Formulierung ähnelnden Variablen, 
die noch nicht durch das gemeinsame latente Konstrukt erklärt wird, zumin- 
dest auch davon ausgegangen werden, dass die gewählten Ausdrücke bei der 
Frageformulierung einen Einfluss haben. 

Das Phänomen dieser begrifflichen Ähnlichkeit soll hier anhand dreier Items 
der Dimension Volume verdeutlicht werden: 


e Es ist gut, dass immer mehr digitale Daten ausgewertet werden. 
e Es ist gut, so viele digitale Daten wie möglich auszuwerten. 
e Es ist erstrebenswert, so viele digitale Daten wie möglich auszuwerten. 


Diese drei Items sind Indikatoren einer Dimension. Wenn nun Befragte den Items 
2 und 3 auf der 7er-Likert-Skala mit „stimme voll und ganz zu“ den Wert 7 zuwie- 
sen, Item 1 jedoch nur „stimme größtenteils zu“ und somit den Wert 6, ist das 
für sich genommen unproblematisch. Wenn allerdings über alle Befragten hinweg 
solch ein Muster auftritt und begriffliche Ähnlichkeit in der Formulierung dazu 
führt, dass zwei Items nicht nur wegen der gemeinsamen Zugehörigkeit zu einem 
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gleichen Konstrukt, sondern auch aus speziell diesem Grund ähnlich beantwortet 
werden, kann dies zu einem systematischen Messfehler führen, der im Modell 
eben nicht berücksichtigt wird. In diesem Fall kann eines der beiden Items elimi- 
niert werden, unter der Voraussetzung, dass die Faktorladung des beibehaltenen 
Items gleich oder höher ausfällt, aber mind. größer als .70 ist. 

Es wurde beim Ausschluss nach Modifikationsindizes darauf geachtet, zuerst 
Items zu eliminieren, für die mehrere (hohe) Modifikationsindizes vorlagen und 
deren addierte Werte größer waren als für andere Items (Kline, 2011). So wurden 
zunächst Items eliminiert, die auf mehrere latente Konstrukte luden und deren 
Fehlerterme mit denen anderer Variablen kovariierten. 


Konstanthaltung der Itemformulierungen 

Bei der Respezifikation der Messmodelle wurde zudem auch auf die jeweiligen 
Formulierungen der Items einer (Sub-)Dimension geachtet, um eine Vergleich- 
barkeit der Dimensionen und ihrer Items auch im Hinblick auf den Wortlaut der 
Fragebogenitems zu gewährleisten. Als Beispiel diente hier die Unterscheidung 
des Umgangs mit digitalen Daten in Erzeugung, Speicherung und Auswertung 
der Daten. 

Es wurde eingangs vermutet, dass durchaus zwischen diesen Handlungen 
unterschieden werden kann und auch die Befragten hier Unterschiede machen 
könnten. Wenn sich allerdings zeigen würde, dass Befragte (in einer oder meh- 
reren der Dimensionen) keinen Unterschied sähen, sobald beide Formulierungen 
vorhanden sind, dann wäre es nach Ansicht des Autors dennoch sinnvoll, eine der 
gewählten Formulierungsweisen für die finale Zusammensetzung der Skalenitems 
beizubehalten. Das bedeutet, entweder nur von Erzeugung oder Speicherung zu 
sprechen, selbst wenn sich zeigen sollte, dass die Befragten bei der Beantwor- 
tung der Items der ersten Erhebung keinen Unterschied machen sollten, um zu 
vermeiden, dass es in der weiteren Verwendung der Skalenitems in Folgestudien 
dann nicht doch zu einer möglichen Verwirrung bei manchen Befragten kommt. 
Diese könnten bspw. nun plötzlich doch vermuten, dass ein Unterschied gemeint 
sein könnte, wenn plötzlich für eine Dimension von Erzeugung und in der ande- 
ren von Speicherung gesprochen würde. Das heißt in der Konsequenz, dass auch 
Items aus dem Modell entfernt werden konnten, für die möglicherweise keine 
Anhaltspunkte vorlagen, die nach den beiden zuvor vorgestellten Ausschlusskri- 
terien zu einem Ausschluss geführt hätten. Weitere Ausführungen hierzu finden 
sich nachfolgend in den Abschnitten zu den jeweiligen Dimensionen. 


134 9 Studie 1 - Durchführung der Skalenkonstruktion 


Zusammenfassend wurden für die Identifikation geeigneter Frageitems die drei 
zuvor beschriebenen Strategien angewendet: 1) die Betrachtung der standardi- 
sierten Faktorladungen, 2) die Verwendung der Modifikationsindizes und 3) die 
möglichst konstante Begriffsverwendung in der Itemformulierung. 


Die Evaluation der CFA-Modelle — notwendige Prüfschritte für die Beurteilung 
reflektiver Messmodelle 

Für die Beurteilung der reflektiven Messmodelle wird ein schrittweises Prüfver- 
fahren angewendet. Zunächst wird die Reliabilität der Indikatoren der reflektiven 
Messmodelle geprüft und eine allgemeine Plausibilitätsprüfung der geschätzten 
Lösung vorgenommen, bevor die Anpassungsgüte der spezifizierten CFA-Modelle 
geprüft wird. 


Reliabilität der Indikatoren 

Die Reliabilität gibt Auskunft über die Zuverlässigkeit bzw. die Genauigkeit der 
Messung (Bandalos, 2017). Die Faktorladungen der reflektiven Indikatoren soll- 
ten daher > .7 sein. Zudem wird für die jeweiligen Indikatoren einer Dimension 
die tau-äquivalente Reliabilität angegeben werden. Dieses Maß, dass auch unter 
dem Begriff des Cronbachschen « firmiert, findet in den Sozialwissenschaften 
weite Verbreitung, ist in der Vergangenheit jedoch zunehmend als ungenau in 
die Kritik geraten, da es kein geeignetes Maß für die Homogenität und die Ein- 
dimensionalität der Indikatoren ist (Cho, 2016; Schmitt, 1996). Es wird daher 
ebenfalls häufig empfohlen, die durchschnittlich extrahierte Varianz (DEV) zu 
berichten. „Diese gibt an, wie viel Prozent der Streuung des latenten Konstruktes 
über die Indikatoren durchschnittlich erklärt wird“ (Weiber & Mühlhaus, 2014, 
S. 151). Als Schwellenwert wird üblicherweise ein DEV-Wert von > .5 angesehen, 
da durchschnittlich die Hälfte der Varianz auf den latenten Faktor des gemesse- 
nen Konstrukts zurückgeht (Fornell & Larcker, 1981; Segars, 1997; Weiber & 
Miihlhaus, 2014). Es werden daher nachfolgend die Werte für das standardisierte 
Cronbachsche a sowie die DEV angegeben. Die Berechnung des Cronbachschen 
a erfolgte mit SPSS 23 während die Berechnung der DEV manuell durchgeführt 
wurde.® 


8 Die Berechnung erfolgte gemäß Weiber und Mühlhaus (2014, S. 151) mit folgender For- 
mel: 


т Wi 
DEVE) esoe am 
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Die Plausibilitätsprüfung der geschätzten Lösung 

Alle berichteten Modelle wurden zudem zunächst auf Heywood Cases geprüft, 
d. h., es wurde еше Plausibilitätsprüfung durchgeführt. Heywood Cases liegen bei 
geschätzten Modellen vor, bei denen die Parametermatrizen nicht ‚positiv definit‘ 
sind, was sich an negativen Varianzen, Kommunalitäten > 1 und Korrelationen 
> 1 äußert (Kline, 2011; Weiber & Mühlhaus, 2014). Solche Werte sind unplau- 
sibel, weshalb Modelle mit Heywood Cases abgelehnt werden müssen. Es gibt 
keine Möglichkeiten, Heywood Cases bei einem Datensatz zu heilen, außer den 
Datensatz zu verändern, bspw., indem man neue zusätzliche Fälle erhebt (West 
et al., 1995). 


Die Anpassungsgüte des geschätzten Modells 

Um die Anpassungsgüte des spezifizierten Modells zu prüfen, gibt es eine Viel- 
zahl von Kriterien sowie Kennwerten für die Evaluation des Kausalmodells, 
wobei Letztere auch als Fit-Maße bezeichnet werden. „Eine hohe Güte eines Kau- 
salmodells (sog. Modell-Fit) ist allgemein dann gegeben, wenn die mit Hilfe der 
Parameterschätzer berechneten Varianzen und Kovarianzen möglichst gut mit den 
empirisch gewonnenen Varianzen und Kovarianzen übereinstimmen“ (Weiber & 
Mühlhaus, 2014, S. 203). 

Das wichtigste Gütekriterium ist dabei der Chi-Quadrat-Test, dessen Bedeu- 
tung und Gültigkeit in der Literatur jedoch kontrovers diskutiert wird. Bspw. 
neigt der Test dazu, leicht auf die Stichprobengröße zu reagieren, was laut Kline 
(2011) bei Samplegrößen von 200 bis 300 Probanden noch unproblematisch ist, 
bei größeren Stichproben” aber leicht zu einer Ablehnung des Modells führen 
kann. Während etliche Autoren für eine strenge Beachtung des Chi-Quadrat- 
Tests argumentieren (Barrett, 2007; Kline, 2011), gibt es auch Quellen, die diese 
Strenge ablehnen (Bentler & Bonett, 1980) oder zumindest im Gesamtkontext der 
Modellkonzeption betrachten möchten (Vandenberg, 2006).!9 

Um auf die Strenge des Chi-Quadrat-Tests zu reagieren, hat sich zudem eta- 
bliert, bei der Evaluation eines Gesamtmodells zur Güteprüfung noch absolute 
und inkrementelle Fit-Maße heranzuziehen (Holbert & Stephenson, 2002; Wei- 
ber & Mühlhaus, 2014). Absolute Fit-Maße prüfen, ob das Modell konsistent mit 
den Daten ist, ohne ein Vergleichsmodell heranzuziehen. Inkrementelle Fit-Maße 
hingegen stellen auf einen Vergleich zwischen dem spezifizierten Modell (auch 
Default-Modell genannt) und einem unabhängigen Modell ab. Das Heranziehen 


9 Hierzu zählen laut Kenny (2015) bereits Stichproben mit mehr als 400 Fällen. 


10 Für eine weitere Übersicht über die Debatte sei an dieser Stelle auch auf das Sonderheft 
von Personality and Individual Differences (2007, 42(5)) verwiesen. 
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dieser Gütekriterien hat sich in den Sozialwissenschaften etabliert, selbst wenn 
es keine einheitlichen Standards gibt, welche Fit-Maße herangezogen und welche 
Cut-off-Kriterien angelegt werden sollten (Holbert & Stephenson, 2002). 
Letztendlich empfiehlt es sich a priori festzulegen, welche Evaluationskriterien 
herangezogen werden, um die Anpassungsgüte der geprüften Modelle zu beur- 
teilen. In der vorliegenden Arbeit wird der Modellfit daher durch die Angaben 
der folgenden Kriterien und Werte geprüft: Für die Evaluation des Gesamtmo- 
dells werden der Chi-Quadrat-Test (X?) und der ‚Root Mean Square Error of 
Approximation‘ (RMSEA) herangezogen. Während der ermittelte Chi-Quadrat- 
Test nicht-signifikant sein sollte, ist seine Anwendung voraussetzungsreich und 
unterliegt, wie zuvor diskutiert, diversen Limitationen (Kline, 2011; Weiber & 
Mühlhaus, 2014). Mit Blick auf den RMSEA besagt eine geläufige Daumen- 
regel, dass der jeweilige Test-Wert im Idealfall nicht größer als .05 sein sollte 
(Browne & Cudeck, 1992), wobei zusätzlich das 90 %-Konfidenzintervall (Con- 
fidence Interval — CI) angegeben wird. Hier sollte die untere Grenze (LO90) nahe 
0 liegen und die obere Grenze (HI9O) nicht größer als .08 sein (Kenny, 2015). 
Zudem wird nachfolgend der Tucker-Lewis-Index (TLI) als inkrementelles 
Fit-Maß herangezogen. Der Nachteil des TLI ist, dass dieser nicht-normiert ist, 
also auch Werte > 1 annehmen kann, wobei ein Wert > 1 für gewöhnlich auf 
1.00 abgerundet wird. Weiber und Mühlhaus (2014) geben als Schwellenwert 
für den TLI Werte von mind. .90 an, laut L. Hu und Bentler (1999) sollte 
der Wert mind. bei .95 oder besser liegen. Es wird zusätzlich zum TLI auch 
häufig noch der Wert des Comparative Fit Index (CFI) angegeben (L. Hu & 
Bentler, 1999; Schreiber et al., 2006). Kenny (2015) rät hiervon jedoch mit fol- 
gender Begründung ab: “Because the TLI and CFI are highly correlated only 
one of the two should be reported. The CFI is reported more often than the 
TLI, but I think the CFI’s penalty for complexity of just 1 is too low and so 
I prefer the TLI even though the CFI is reported much more frequently than 
the ТЕГ” (Kenny, 2015, $ 10). Nachfolgend werden daher für alle Modelle der 
Chi-Quadrat-Test, der RMSEA samt 90 %-Konfidenzintervall sowie der TLI 
angegeben. Die Werte werden durchgängig wie folgt berichtet, wobei kursiv 
gesetzte Wörter durch die entsprechenden Werte ersetzt werden: (X?(df — Frei- 
heitsgrade) = Chi-Quadrat-Wert, р < Signifikanzwert, RMSEA = RMSEA-Wert 
[90 %-Konfidenzintervall: LO90-Wert, HI90-Wert]; TLI = TLI-Wert). Bei den 
Messmodellen der unidimensionalen Faktoren werden zudem noch das Cron- 
bachsche o und die durchschnittlich extrahierte Varianz (DEV) ausgewiesen. Für 
den Vergleich von hierarchischen Modellen (‚Model Comparisons‘) wird zudem 
der Chi-Quadrat-Differenz-Test herangezogen (Weiber & Mühlhaus, 2014). Dies 
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ist bspw. der Fall, wenn man die spezifizierten latenten Faktoren auf Diskrimi- 
nanzvalidität prüfen möchte (siehe nachfolgender Abschnitt), aber auch bei der 
Prüfung von Messinvarianz sowie der Restriktion anderweitiger Modellparame- 
ter. Für die Evaluation nicht-hierarchischer Modelle, also Modelle, die zwar auf 
Grundlage der gleichen Indikatoren und Daten spezifiziert werden, jedoch eine 
gänzlich andere Spezifikation der Kausalpfade haben, wird zudem das Akaike 
Information Criterion (AIC) herangezogen (Kline, 2011). 


Prüfung der Diskriminanzvalidität der BDGS-Dimensionen 

Es ist zu diskutieren, inwieweit mit Blick auf die unterschiedenen Faktoren von 
diskriminanter Validität ausgegangen werden kann, d. h., messen die Indikato- 
ren tatsächlich auch empirisch die konzeptuell unterschiedlichen Dimensionen 
der BDGS-Skala oder kann empirisch eben nicht unterschieden werden. Letz- 
teres wäre bspw. der Fall, wenn die Befragten nicht zwischen den Indikatoren 
der einzelnen Dimensionen unterscheiden würden, also die einzelnen Indikatoren 
so hoch miteinander korrelieren, dass davon ausgegangen werden muss, dass sie 
die gleiche Ursache teilen (sprich: ein gemeinsames latentes Konstrukt, das ihre 
jeweilige Ausprägung beeinflusst). Weiber und Mühlhaus (2014) merken hierzu 
an: „Diskriminanzvalidität als Teilaspekt der Konstruktvalidität liegt vor, wenn 
sich die Messungen verschiedener Konstrukte signifikant unterscheiden“ (S. 164). 
Im Rahmen der CFA gibt es zwei Möglichkeiten der Prüfung auf Diskriminanz- 
validität: 1) den Chi-Quadrat-Differenztest und 2) das Fornell-Larcker-Kriterium, 
das dem ‚DEV vs. geteilte Varianz‘-Test zugrunde liegt (Farrell, 2010; Weiber & 
Mühlhaus, 2014). 

Es wird bei der Prüfung auf Diskriminanzvalidität daher zunächst ein Chi- 
Quadrat-Differenztest durchgeführt, bei dem das nicht-restringierte Modell, für 
das die Kovarianz zwischen den beiden Faktoren frei geschätzt wird, einem 
restringierten Modell gegenübergestellt wird, „wobei das restringierte Modell bei 
Vorliegen von Diskriminanzvalidität auf jeden Fall die schlechtere Güte aufwei- 
sen muss“ (Weiber & Mühlhaus, 2014, S. 164). Beim restringierten Modell wird 
folglich die Kovarianz zwischen den beiden Faktoren auf den Wert 1 fixiert. Ist 
der Chi-Quadrat-Differenztest für den Modellvergleich signifikant, spricht dies 
aus empirischer Sicht für Diskriminanzvalidität. 

Die zweite Möglichkeit, Diskriminanzvalidität zu prüfen, ist die Verwendung 
des Fornell-Larcker-Kriteriums, eines Tests, bei dem das Verhältnis der DEV der 
Faktoren zur gemeinsam geteilten Varianz in Beziehung gesetzt wird (Farrell, 
2010; Fornell & Larcker, 1981). 
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Dieses Kriterium ist dabei wesentlich strenger [als der Chi-Quadrat-Differenztest] 
und stellt die durchschnittlich durch einen Faktor erfasste Varianz (...) mit jeder 
quadrierten Korrelation (Ф24), die der betrachtete Faktor i mit einem anderen Fak- 
tor j aufweist, gegenüber. Da die quadrierte Korrelation zwischen zwei Faktoren 
als gemeinsame Varianz dieser Faktoren interpretiert werden kann, liegt nach For- 
nell/Larcker Diskriminanzvalidität dann vor, wenn diese gemeinsame Varianz kleiner 
ist als die DEV der jeweiligen Faktoren. (Weiber & Mühlhaus, 2014, S. 165) 


Auch mit Blick auf die Prüfung der Diskriminanzvalidität ist an dieser Stelle der 
Skalenkonstruktion erneut auf das Verhältnis zwischen der Konzeption und dem 
Erkenntnisinteresse des BDGS und der empirischen Messung einzugehen. Für 
die Bewertung der Datenpassung zum vorgeschlagenen Modell haben sich die 
im vorigen Abschnitt beschriebenen Konventionen etabliert. Auch hier muss an 
der entsprechenden Stelle jedes Mal erneut abgewogen werden, zwischen stren- 
gem statistischen Test (der wohlgemerkt wie jede zur Konvention gewordene 
Daumenregel recht willkürlich gewählte Grenzen festlegt) und der konzeptio- 
nellen Unterscheidung in einzelne Dimensionen, denen innerhalb des BDGS eine 
bestimmte Bedeutung zukommt. Da die einzelnen Dimensionen des BDGS kon- 
zeptuell zusammenhängen und — insbesondere im Aggregat — eine Verbindung 
zwischen hoch ausgeprägten Wissensüberzeugungen und Nutzenerwartungen 
erwartet wird, werden nachfolgend die Prüfungen auf Diskriminanzvalidität ent- 
sprechend den Vorgaben aus der Literatur durchgeführt, jedoch nicht unhinterfragt 
auf Grundlage von Grenzwerten angenommen oder abgelehnt, sondern jeweils im 
Lichte der Skalenkonzeption reflektiert. 

Die Prüfung der Diskriminanzvalidität hoch korrelierter und konzeptuell ähn- 
licher Dimensionen wird in Abschnitt 9.1.6 ergänzt um eine Diskussion und 
Prüfung der ‚dimensionalen Verschiedenheit‘ (DV) des spezifizierten Models, 
bei der alle miteinander korrelierten latenten Konstrukte im Correlated-Factor- 
Modell (CFM) einem Second-Order-Factor-Modell (SOFM) gegentibergestellt 
werden (Gignac & Kretzschmar, 2017). Die Prüfung DV bezieht sich dabei auf 
das Gesamtmodell und die Plausibilität der Annahme separierbarer Dimensionen 
im Gesamtmodell. 


9.1.4 Die Richtigkeit digitaler Daten - die Dimensionen 
Genauigkeit, Wahrhaftigkeit und Objektivität digitaler 
Daten sowie der hieraus resultierende Wissensgewinn 


Ausgehend von der in Abschnitt 3.5.1 getroffenen Unterteilung der Richtigkeit der 
digitalen Daten in die zugehörigen Dimensionen Genauigkeit, Wahrhaftigkeit und 
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Objektivität sowie den Wissensgewinn wird die Datenauswertung durchgeführt. 
Aus Darstellungsgründen wird die Dimension Wahrhaftigkeit und Objektivi- 
tät dabei nachfolgend nur als Wahrhaftigkeit bezeichnet. Die in Tabelle 2.C 
im Anhang im elektronischen Zusatzmaterial gelisteten 18 Items betrafen die 
Bewertung jener drei Subdimensionen der Richtigkeit im Entstehungs- und 
Verwertungskontext digitaler Daten. 

Eine CFA, die mit den imputierten Daten für das Messmodell gerechnet wird 
und bei dem jeweils sechs Indikatoren in einem Single-Factor-Modell (SFM) auf 
einen zugrunde liegenden latenten Faktor laden, zeigt eine geringe Anpassungs- 
вше (X?(132) = 365.32, р < .001; RMSEA = .083 [.073, .094]; TLI = .922) 
und wird abgelehnt. Mit einer Ausnahme!! haben alle Items eine Faktorladung 
von mindestens } = .714. Zwar zeigt sich mit Blick auf die interne Konsistenz 
der Faktoren, dass die jeweiligen Indikatoren der Dimensionen Genauigkeit (a 
= .908; DEV = .636), Wahrhaftigkeit (a = .895; DEV = .591) und Wissens- 
Gewinn (a = .914; DEV = .649) hohe Reliabilitätswerte aufweisen. Doch auch 
hier haben etliche Items der distinkten Faktoren eine gemeinsam geteilte Vari- 
anz, die nicht durch den gemeinsamen latenten Faktor erklärt wird, so dass die 
Kovarianz der Fehlerterme freigegeben werden müsste, um frei zu variieren. Es 
zeigt sich mit Blick auf die beiden latenten Konstrukte Genauigkeit und Wahr- 
haftigkeit der digitalen Daten eine sehr hohe Korrelation (rGenauigkeit, Wahrhaftigkeit 
= .903), die auch hier darauf hinweist, dass möglicherweise nicht von diskri- 
minanter Validität zwischen den beiden Faktoren ausgegangen werden kann. Die 
Korrelationen zwischen dem Faktor Genauigkeit und dem Faktor Wissensgewinn 
(FGenauigkeit,Wissensgewinn = -874) bzw. zwischen dem Faktor Wahrhaftigkeit und 
dem Faktor Wissensgewinn (r Wahrhaftigkeit, Wissensgewinn = -734) sind ebenfalls hoch. 


Diskriminanzvalidität der Richtigkeitsdimensionen 

Es ist zu diskutieren, inwieweit mit Blick auf die drei unterschiedenen Fak- 
toren im CFM noch von diskriminanter Validität ausgegangen werden kann, 
d. h., messen die Indikatoren tatsächlich auch empirisch die drei konzeptuell 
unterschiedlichen Dimensionen der Richtigkeit oder kann empirisch eben nicht 
unterschieden werden. Wie in Abschnitt 9.1.3 beschrieben, gibt es im Rahmen 


11 Das Item „Digitale Daten können als eine höhere Form von Intelligenz betrachtet werden‘ 
hat lediglich eine Faktorladung von X = .606. Dies ist insofern erwähnenswert, als dass die- 
ses Item unmittelbar auf den von boyd und Crawford benannten Kern des Mythos Big Data 
abstellt: “large data sets offer a higher form of intelligence and knowledge” (2012, S. 663). 
Unbenommen ist hier, dass die wortwörtliche Übersetzung aus dem Englischen ins Deut- 
sche im Original anders verstanden werden kann und geläufiger ist als die zugegebenermaßen 
holprig klingende deutsche Version. 
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der CFA zwei Möglichkeiten der Prüfung auf Diskriminanzvalidität: 1) den Chi- 
Quadrat-Differenztest und 2) das Fornell-Larcker-Kriterium (Weiber & Mühlhaus, 
2014). Wie erwähnt, ist das Fornell-Larcker-Kriterium der strengere Test und es 
wird schnell deutlich, dass die quadrierten Korrelationen der Faktoren Genauig- 
keit und Wahrhaftigkeit (72 Genauigkeit, Wahrhaftigkeit = .815) sowie Genauigkeit und 
Wissensgewinn (r? Genauigkeit, Wissensgewinn = -764), mit Blick auf die Angaben zur 
DEV weiter oben, die Annahme der Diskriminanzvalidität nicht bestätigen kön- 
nen, während er für die Faktoren Wahrhaftigkeit und Wissensgewinn angenommen 
wird (т? Wahrhaftigkeit, Wissensgewinn = .539). 

Das bedeutet, dass zwar konzeptionell zwischen der Genauigkeit und der 
Wahrhaftigkeit der Daten unterschieden werden kann, dieser Unterschied jedoch 
von den Befragten in der Zustimmung zu den Frageitems nicht gemacht wird, 
eine getroffene Unterscheidung zwischen diesen Konzeptdimensionen also nicht 
beobachtbar ist. Jemand, der erwartet, dass Daten ein genaues Verständnis der 
Welt ermöglichen, bewertet diese Erkenntnis auf Datengrundlage auch als objek- 
tiv und wahrhaftig. So ist bspw. die mögliche Einschätzung, dass ein möglicher 
Bias in präzise dokumentierten Daten dazu führt, dass die Daten zwar genau das 
wiedergeben, was sie messen, aber dennoch nicht ‚objektiv‘ sind und diskrimi- 
nieren, zumindest über alle Befragten hinweg auf dem Abstraktionsniveau der 
vorliegenden Indikatoren nicht zu beobachten. 

Als Konsequenz wurden in einem ersten Schritt die Faktoren Genauigkeit und 
Wahrhaftigkeit zusammengelegt, so dass die zwölf Items, die diesen Faktoren 
zugrunde lagen, nun auf einen gemeinsamen Faktor luden und ein Modell mit 
zwei Faktoren ‚Wahrhaftigkeit/Genauigkeit‘ und ‚Wissensgewinn‘ geprüft wurde. 
Die CFA für dieses Modell, das mit den imputierten Daten gerechnet wurde, zeigt 
weiterhin eine geringe Anpassungsgüte (Х2(135) = 640.598, р < .001; RMSEA 
= .121 [.112, .131]; TLI = .835) und muss abgelehnt werden. 

Das Modell wurde nun nach dem im vorigen Abschnitt dargestellten Vorgehen 
respezifiziert. Insbesondere wurden nur unzureichend auf die Faktoren ladende 
Items eliminiert und es wurde mit Blick auf die Zusammenlegung der beiden 
Dimensionen Genauigkeit und Wahrhaftigkeit darauf geachtet, dass letztendlich 
Items, die den Kern beider Dimensionen betrafen, mit in die finale Messung 
aufgenommen wurden. Hier wurden allerdings mit Rücksicht auf den mögli- 
chen Konflikt zwischen den Begrifflichkeiten Wahrheit und Wissen sowie die 
erforderliche Trennschärfe der Konstrukte Objektivität und Wissensgewinn die 
Items eliminiert, die den Wahrheitsbegriff beinhalten. Die Items für den Fak- 
tor ‚Genauigkeit/Wahrhaftigkeit‘ betreffen mithin die Genauigkeit der Abbildung 
realweltlicher Gegebenheiten, die auch mit Blick auf die Objektivität von einer 
Fehlerfreiheit und Unverzerrtheit der digitalen Daten ausgeht und dahingehend 
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eine präzise wahrhaftige Repräsentation der Welt in diesen abbildbar findet und 
erfahrbar macht. 

Um in den nachfolgenden Beschreibungen nicht jedes Mal den umständlichen 
Doppelbegriff mitzuführen und mögliche Irritationen bezüglich der Zugehörig- 
keit zur Beschreibungsdimension Veracity zu vermeiden, wird die Dimension 
‚Genauigkeit/Wahrhaftigkeit‘ lediglich als Dimension ‚Genauigkeit‘ bezeich- 
net. Die nachfolgend angegebenen Item-IDs werden von hier an durchgängig 
gebraucht, um das jeweilige Frageitem zu identifizieren. Das finale Modell 
besteht mithin aus den zwei zuvor genannten latenten Faktoren Genauigkeit und 
Wissensgewinn, auf die die folgenden sechs Indikatoren laden. 


Genauigkeit 


e Digitale Daten ermöglichen ein genaues Verständnis der Welt. (Item-ID GE]; 
AgEı = .808, Referenzindikator) 

e Digitale Daten ermöglichen ein exaktes Verständnis der Welt. ID GE2; Aer? 
= .840) 

e ID СЕЗ: Digitale Daten ermöglichen ein objektives Verständnis der Wirklich- 
keit. (ID СЕЗ; Ускз = .824) 


Wissensgewinn 


e Digitale Daten verhelfen zu neuem Wissen. (ID WI Ху = .804, Referenzin- 
dikator) 

e Digitale Daten führen zu neuen Fakten. (ID W2; }w2 = .779) 

e Digitale Daten verhelfen zu neuen Erkenntnissen. (ID ИЗ, X\w3 = .886) 


Die CFA fiir dieses Modell, das mit den nicht-imputierten Daten gerechnet wurde, 
kommt zu einer plausiblen Losung und zeigt eine zufriedenstellende Anpassungs- 
güte (X?(8) = 11.062, р = .198; RMSEA = .039 [.000, .089]; TLI = .990) und 
wird folglich angenommen. Allerdings zeigt sich auch hier fiir Genauigkeit (a 
= .867; DEV = .679) und Wissensgewinn (a = .853; DEV = .679) eine hohe 
Interkorrelation beider Faktoren (r = .829, r= .687), welche die Diskriminanz- 
validität in Frage stellt. Da die DEV beider Faktoren mit jeweils genau .679 
leicht niedriger liegt als die quadrierte Korrelation wird hier dennoch zugunsten 
der Zwei-Faktor-Lösung entschieden, wobei zu prüfen sein wird, inwieweit sich 
Diskriminanzvalidität in Folgeerhebungen zeigt oder nicht. Die Aufrechterhaltung 
der konzeptionellen und der empirischen Trennung in der Modellierung und der 
Erhebung der Items für die zwei Faktoren wird auch dahingehend fortgeführt, 
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als dass vorstellbar ist, dass je nach Studienschwerpunkt und Forschungsfragen 
in der Anschlussforschung eine Aufteilung sinnvoll sein könnte. Es muss hier 
jedoch auch bedacht werden, dass die Multi-Kollinearität beim BDGS ein gene- 
relles Problem darstellt, da sich zeigt, dass alle Dimensionen hoch miteinander 
korreliert sind. Diese Fragen betreffen nachfolgend auch die Trennung der nun 
folgenden Nutzendimension. 


9.1.5 Die Nutzendimensionen des BDGS 


Mit Blick auf den aus den Daten gezogenen Nutzen wird im BDGS und somit 
auch in den Befragungsitems zwischen einem persönlichen Nutzen für das Indi- 
viduum (‚Individueller Nutzen‘) und dem Nutzen für die Gesamtgesellschaft 
(‚Gesellschaftlicher Nutzen‘) unterschieden (siehe Abschnitt 3.5.2). Mit Blick 
auf die Frageitems der letzteren Dimension blieb in der Einleitung und den 
Aussagen offen, wer oder was unter dem Begriff der Gesellschaft gemeint ist. 
Es wurde nicht zwischen einer vermeintlich vagen Allgemeinheit oder einer 
konkreten Gesellschaft (wie bspw. einer europäischen oder einer nationalen 
Gesellschaft) abgestuft. Das hat zur Folge, dass Befragte ganz verschiedene Dinge 
mit dem Gesellschaftsbegriff verbinden, mithin unterschiedliche Vorstellungen 
davon haben können, was Gesellschaft ausmacht, woraus und aus wem sie jeweils 
besteht (Kölbl & Althof, 2014). Es zeigt sich dann auch, dass mit Blick auf 
das Individuum und die menschliche Identitätswahrnehmung ganz unterschied- 
liche Verständnisse von Gesellschaft zwischen einem Zugehörigkeitsgefühl zu 
einer Weltgesellschaft und regionalen, gar lokalen Verbünden existieren (Herr- 
mann et al., 2004). Dieses feinteilige Verständnis kann auch mit Blick auf die 
Messung der gesellschaftlichen Nutzenwahrnehmung nur unzureichend operatio- 
nalisiert werden. Während also offenbleibt, was oder wen die Befragten nun 
zur situativ imaginierten Gesellschaft zählen, so sollte durch die Kontrastie- 
rung mit Items, die auf den individuellen Nutzen aus digitaler Datensammlung 
und -verwertung abstellen, deutlich werden, dass hier bezüglich eines Kollektivs 
gefragt wird, zu dem die Befragten in Beziehung stehen, als dessen vollstän- 
dig zugehörige Mitglieder sich die Befragten jedoch nicht zwingend verstehen 
müssen. Die Modellierung der beiden Dimensionen und die Datenanalyse der 
Frageitems werden im folgenden Abschnitt nachvollzogen. 
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Der individuelle und gesellschaftliche Nutzen im Entstehungs- und Verwertungs- 
kontext digitaler Daten 

Die ersten sieben der 15 in Tabelle 2.C gelisteten Items betrafen die Erwartung 
eines individuellen Nutzens aus dem Entstehungs- und Verwertungskontext digi- 
taler Daten. Sprich: Glaubt bspw. eine bestimmte Befragte, dass sie persönlich 
einen Nutzen für sich selbst aus der Datensammlung und -verwertung zieht. Dabei 
wurde nicht zwischen dem Entstehungs- und Verwertungskontext unterschieden, 
sondern die Items fragten im Präsens formuliert, ob ein Nutzen wahrgenommen 
wird. Die letzten acht Items stellten dann auf den gesellschaftlichen Nutzen ab, 
der sich aus dem Entstehungs- und Verwertungskontext digitaler Daten ergibt. 

Eine CFA, die mit den imputierten Daten für das Messmodell gerechnet wird 
und bei dem alle 15 Nutzen-Indikatoren im SFM auf einen latenten Faktor laden, 
zeigte eine unzureichende Anpassungsgüte (X?(90) = 299.515, р < .001; RMSEA 
= .096 [.084, .108]; TLI = .924) und wird abgelehnt. Zwar haben alle Items eine 
Faktorladung von mindestens X = .709. Doch auch hier haben etliche Items eine 
gemeinsame geteilte Varianz, die nicht durch den gemeinsamen latenten Faktor 
erklärt wird, so dass hier entweder die Kovarianz der Fehlerterme freigegeben 
werden müsste, um frei zu variieren, oder aber eine mehrdimensionale Lösung 
mit zwei oder mehr Faktoren gerechnet werden sollte. 

Es wurde anschließend ein Modell geprüft, bei dem zwischen dem indi- 
viduellen und gesellschaftlichen Nutzen unterschieden wurde, der aus digitalen 
Datenbeständen gezogen wird. Das Modell bestand aus den zwei latenten Fak- 
toren individueller Nutzen (sieben reflektive Indikatoren) und gesellschaftlicher 
Nutzen (acht reflektive Indikatoren). Die jeweiligen Items luden allein auf den 
jeweiligen latenten Faktor. Das Modell sah keine Kreuzladungen vor und die 
latenten Faktoren konnten frei miteinander kovariieren. Die geschätzte Lösung 
der CFA ist zulässig. Das Modell, das mit den imputierten Daten gerechnet 
wurde, zeigt weiterhin eine insgesamt noch akzeptable Anpassungsgüte (X?(89) 
= 156.822, р < .001; RMSEA = .055 [.040, .069]; TLI = .975), auch wenn 
es mit Blick auf den Chi-Quadrat-Test abgelehnt werden muss. Es zeigt sich 
darüber hinaus, dass zwischen den beiden latenten Konstrukten eine hohe Kor- 
relation besteht (Findividueller Nutzen, gesellschaftlicher Nutzen = .897), was mit Blick auf 
die diskriminante Validität der beiden konzeptuell unterschiedlichen Dimensionen 
näher zu betrachten ist. 
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Zunächst wurde das Modell jedoch wiederum nach dem in Abschnitt 9.1.3 dar- 
gestellten Vorgehen respezifiziert, um Items zu eliminieren, die hoch miteinander 
kovariierten oder im Vergleich schlechter auf die jeweiligen latenten Faktoren 
luden. Das finale Modell besteht aus zwei latenten Faktoren, auf die jeweils die 
folgenden drei Indikatoren laden. Auch hier werden nachfolgend die angegebe- 
nen Item-IDs von nun an durchgängig vergeben und gebraucht, um das jeweilige 
Frageitem zu identifizieren. 


Individueller Nutzen 


e Digitale Daten erzeugen für mich persönlich einen Mehrwert. (Item-ID IN1; 
Ami = .838, Referenzindikator) 

e Digitale Daten führen für mich zu Vorteilen. (ID IN2; Aın2 = .817) 

e Digitale Daten haben für mich persönlich positive Auswirkungen. (ID IN3; 
Am3 = .839) 


Gesellschaftlicher Nutzen 


e Digitale Daten erzeugen einen Mehrwert für die Gesellschaft. (ID GNI; Acnı 
= .823, Referenzindikator) 

e Digitale Daten führen zu gesellschaftlichen Vorteilen. (ID GN2; Agn2 = .809) 

e Digitale Daten sind ein gesellschaftlicher Gewinn. (ID GN3; Хсмз = .839) 


Die CFA fiir dieses Modell, gerechnet mit den nicht-imputierten Daten, kommt 
zu einer plausiblen Lösung und zeigt eine hohe Anpassungsgiite (Х2(8) = 2.174, 
p = .975; RMSEA = .000 [.000, .000]; TLI = 1.016), mit Faktorladungen von 
mindestens X = .801. 


Diskriminanzvalidität der Nutzendimensionen 

Die jeweils drei Indikatoren der final modellierten Faktoren individueller Nut- 
zen (а = .874; DEV = .700) und gesellschaftlicher Nutzen (a = .863; 
DEV = .676) zeigen eine hohe Reliabilität und konvergente Validität der 
Indikatoren, jedoch auch eine sehr hohe Korrelation zwischen den Faktoren 
(Findividueller Nutzen, gesellschaftlicher Nutzen = .915). Wie bereits im vorhergehenden 
Abschnitt angedeutet, ist zu diskutieren, inwieweit mit Blick auf die beiden Fak- 
toren noch von diskriminanter Validität ausgegangen werden kann: D. h., messen 
die Indikatoren tatsächlich auch empirisch die zwei konzeptuell unterschiedli- 
chen Dimensionen des Nutzens oder kann empirisch eben nicht unterschieden 
werden? Auch hier wurden, wie eingangs in Abschnitt 9.1.3 beschrieben, zur 
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Prüfung auf Diskriminanzvalidität 1) der Chi-Quadrat-Differenztest und 2) das 
Fornell-Larcker-Kriterium herangezogen (Weiber & Mühlhaus, 2014). 

Es wurde daher zunächst ein Chi-Quadrat-Differenztest durchgeführt, bei dem 
das nicht-restringierte Modell einem restringierten Modell gegenübergestellt wird. 
Der Chi-Quadrat-Differenztest für den Modellvergleich (AX? = 6.56, df = 1, p 
< .05) ist signifikant, was fiir Diskriminanzvaliditat spricht. 

Eine weitere Méglichkeit, Diskriminanzvaliditat zu priifen, ist die Verwendung 
des Fornell-Larcker-Kriteriums. Da die durchschnittlich extrahierten Varianzen 
beider Faktoren mit .700, bzw. .676 kleiner sind als deren quadrierte Korrelation 
(т? individueller Nutzen, gesellschaftlicher Nutzen = .837), wäre im vorliegenden Fall keine 
Diskriminanzvalidität gegeben. 

Die sich widersprechenden Ergebnisse zeigen, dass es auch hier keine einheit- 
liche Antwort auf die Frage nach der Diskriminanzvalidität gibt, da diese von 
den willkürlich gesetzten Cut-off-Kriterien abhängt. Auch hier ist mit Blick auf 
konzeptuelle Modellierung und die empirischen Ergebnisse abzuwägen, welcher 
Modellierungsvariante der Vorzug gegeben wird. Mit Blick auf die Nutzendimen- 
sion des BDGS wird der weniger strengen Auslegung gefolgt und die Aufteilung 
in zwei Faktoren beibehalten, die mit persönlichem individuellen und dem 
allgemeinen gesellschaftlichen Nutzen zwei distinkte Dimensionen des Nutzen- 
gewinns auf Grundlage digitaler Daten unterscheidet. Das wird zum einen damit 
begründet, dass mit Blick auf die positive öffentliche Betrachtung der gesamtge- 
sellschaftlichen Konsequenzen der Digitalisierung und der eigenen Erfahrung mit 
digitalen Werkzeugen eine hohe Korrelation des individuell gesehenen Nutzens 
mit dem gesellschaftlichen Nutzen zu erwarten ist. Haben Personen jedoch eine 
negative Bewertung der Folgen für die Gesellschaft, schlägt diese Einschätzung 
möglicherweise auch auf die Bewertung der eigenen Lage durch. Es werden an 
dieser Stelle noch keine Hypothesen aufgestellt oder Prognosen abgegeben. So 
gibt es zumindest keine Hinweise darauf, dass die Nutzenerwartungen für das 
Individuum systematisch vom Gesamtgesellschaftlichen entkoppelt sind. Auch 
wenn dies für bestimmte Personen und Digitalisierungskontexte durchaus mög- 
lich erscheint, müssten entsprechende Annahmen zunächst einmal argumentativ 
für den spezifischen Fall hergeleitet werden. Die Ausführungen zum Glaubens- 
system in Kapitel 6 legen hingegen eher nahe, dass eine Aktivierung des BDGS, 
unter der Annahme eines nicht vollständig durchschaubaren Ursache-Wirkungs- 
Zusammenhangs digitaler Datenentstehung und -verwertung und die hieraus 
entstehenden Konsequenzen, eine im Aggregat relativ undifferenzierte Gesam- 
tevaluation bezüglich der Nutzenerwartung zur Folge hat. Zudem soll ja gerade 
die feinteilige Unterscheidung in die diskreten Dimensionen des BDGS nachfol- 
gend genutzt werden, um zu prüfen, inwieweit einzeln erhobene Glaubenssätze 
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als erklärende Variablen für die empirische Forschung dienen können, wobei 
es je nach Forschungszusammenhang und Befragungskontext sinnvoll ist, zwi- 
schen den Nutzendimensionen unterscheiden zu können. Es ist denkbar, dass 
es Lebensbereiche und mithin Forschungsfragen gibt, für die unterschiedliche 
Bewertungen und Auswirkungen der Nutzenerwartungen dokumentiert werden 
könnten. Aus diesen Gründen ist der konzeptuellen sowie der empirischen Tren- 
nung der Dimensionen in der Modellierung an dieser Stelle zunächst der Vorzug 
zu geben. 


9.1.6 Datenauswertung für das finale Messmodell der 
BDGS-Skala 


Die einzelnen Dimensionen wurden nun, wie in Abbildung 9.2 dargestellt, in 
einem CFM zusammengefasst spezifiziert. 


Individueller 


Nutzen 


У бет Усе Yoes Ya [Yw Yws Yını Vu: Yina Ж Jas Yona 


РЕ т 


бул буз буз Sina Sinz Sins Sent бемо Sens 


бе Ösen Öges 


Abbildung 9.2 Messmodell der vier Dimensionen des BDGS (CFM) 
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Um zu prüfen, ob das finale Messmodell auch zu den ursprünglichen nicht- 
imputierten Daten passt, wurde das finale Gesamt-Modell also noch einmal mit 
dem Ursprungsdatensatz berechnet. Hierbei kommt bei der Parameterschätzung 
die Full-Information-Maximum-Likelihood-Schätzung (FIML) zum Einsatz, für 
die in Amos die Funktion ,Estimate Means and Intercepts‘ ausgewählt werden 
muss, die Durchschnittswerte und Achsenabschnitte der Variablen im Modell 
berechnet. Dabei wurde fiir jede Dimension eines der drei jeweiligen Items als 
Referenzindikator festgelegt (siehe Tabelle 9.2), 4. h., dass dessen Regressions- 
gewicht auf den Wert 1 restringiert wurde. Diese Referenzindikatoren werden 
auch in den weiteren Erhebungen beibehalten. Zudem wurden die Mittelwerte 
der latenten Konstrukte jeweils auf den Wert null restringier. Um in den 
späteren Abschnitten im Rahmen der Hypothesenprüfung zu testen, ob sich 
bspw. die Werte der Achsenabschnitte signifikant vom Skalenmittelpunkt unter- 
scheiden, wurde an den entsprechenden Stellen zusätzlich ein Bootstrapping in 
AMOS für ‚Bias-corrected confidence intervals‘ nach Efron (1987) mit insgesamt 
500 Stichproben durchgeführt. Dieses Bootstrapping-Verfahren wird auch in allen 
nachfolgenden Analysen entsprechend angewandt. 

In Tabelle 9.2 finden sich nun die Itemformulierungen und Kennwerte der 
einzelnen Items der Dimensionsindikatoren sowie Kennwerte für die gesamte 
Dimension. Zudem sind dort die Variablennamen aus dem Originaldatensatz zu 
finden, so wie diese noch in der Tabelle 2.C im Anhang im elektronischen 
Zusatzmaterial vermerkt waren. Diese Variablennamen werden ab hier in eine 
standardisierte, oben bei den Items sowie im Anhang im elektronischen Zusatz- 
material erwähnte Indikatorbenennung geändert, so dass ab hier eine durchgängig 
konsistente Bezeichnung der einzelnen Indikatoren verwendet wird. Es ist somit 
an jeder Stelle in den nachfolgenden Ausführungen zu den Datenauswertungen 
der einzelnen Erhebungen deutlich, über welchen Indikator gesprochen wird. 
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Die CFA für dieses Modell kommt zu einer plausiblen Lösung und zeigt eine 
hohe Anpassungsgüte (X?(48) = 39.138, р = .815; RMSEA = .000 [.000, .026]; 
TLI = 1.007). Die Regressionskonstanten der einzelnen Indikatoren indizieren 
für die Dimensionen Genauigkeit sowie individueller und gesellschaftlicher Nut- 
zen Werte nahe dem Skalenmittelpunkt. Dies ist so zu interpretieren, dass bei 
einer durchschnittlichen Ausprägung des latenten Faktors bei einem Befragten 
der Skalenmittelpunkt des entsprechenden Frageitems gewählt wird. Die Regres- 
sionskonstanten sind daher wie die Mittelwerte einer Stichprobe zu interpretieren, 
wobei es sich aufgrund der ML-Schätzung und der fehlenden Werte für manche 
Befragten nicht um einen beobachteten Mittelwert handelt, sondern eine durch 
FIML geschätzte Konstante der Regressionsgleichung. Für die Indikatoren der 
Dimension Wissensgewinn werden nun höhere Regressionskonstanten beobachtet, 
wenn der Mittelwert des latenten Faktors auf null restringiert wird. Im Durch- 
schnitt liegen die Befragten einen halben bis fast einen ganzen Skalenpunkt von 
der Skalenmitte entfernt, was eine hohe Zustimmung zu den jeweiligen Fragei- 
tems signalisiert. In Tabelle 9.3 finden sich darüber hinaus die Angaben zu den 
Korrelationen der latenten Faktoren, die allesamt hoch miteinander korrelieren. 


Tabelle 9.3 Korrelationsmatrix — Erhebung 1.1: Finales Modell BDGS 


Genauigkeit | Wissensgewinn | Individueller Nutzen 
Genauigkeit 1 
Wissensgewinn .830*** 1 
Individueller Nutzen .809*** .714%%% 1 
Gesellschaftlicher Nutzen .878*** OS LFF ОТЫ» 


Notizen. * р < .05, ** p < .01, *** p < .001 


Mit drei Indikatoren pro latentem Faktor ist zudem eine ausreichende Anzahl 
an Indikatoren gegeben, ohne dass die Erhebung des BDGS mit einer zwölf Items 
zählenden Itembatterie unnötig lang geraten ist. 


Anmerkungen zur dimensionalen Struktur und Modellierung der BDGS- 
Dimensionen unter Berücksichtigung der dimensionalen Verschiedenheit der 
latenten Faktoren 

Die Annahme eines SFM wurde zuvor an den entsprechenden Stellen in einem 
ersten Schritt geprüft und alle Modelle zeigen eine entsprechend schlechtere 
Anpassungsgüte, so dass die Annahme verworfen wurde. Beim finalen BDGS- 
Modell handelt es sich daher zunächst um ein CFM, bei dem davon ausgegangen 
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wird, dass es sich um eigenständige voneinander trennbare Dimensionen han- 
delt, die hoch miteinander korrelieren, jedoch konzeptuell und datenanalytisch 
voneinander trennbar sind. Um zu prüfen, inwieweit diese Annahme haltbar 
ist, empfehlen sich zwei weitere Prüfschritte. Zunächst sollte das CFM einem 
Second-Order-Factor-Modell (SOFM) gegenübergestellt werden, bei dem ein 
Faktor zweiter Ordnung auf die vier Dimensionen lädt. In einem weiteren Schritt 
erlaubt die Spezifikation eines SOFM laut Gignac und Kretzschmar (2017) 
auch bei Annahme des CFM dann, ob die Annahme der DV haltbar ist. Diese 
erlaubt eine spezifische Interpretation der einzelnen Dimensionen innerhalb des 
BDGS und geht somit über die Prüfung der Diskriminanzvalidität zweier hoch 
korrelierter latenter Faktoren hinaus. Letztere fragt danach, ob man zwischen 
zwei Dimensionen unterscheiden kann. Die DV nimmt das Gesamtmodell aller 
latenten Faktoren in den Blick und untersucht die Plausibilität der Annahme 
separierbarer Dimensionen im Gesamtmodell. Die Analyse einzelner Dimensio- 
nen wird bspw. relevant, wenn sie als eigenständige Erklärungsvariablen in der 
Forschung eingesetzt werden oder wenn man zwischen Befragten mit Blick auf 
die einzelnen Dimensionen differenzieren möchte, ohne auf die Ausprägung des 
Gesamtmodells Bezug nehmen zu müssen. 

Die Prüfung auf DV erfolgt also in einem ersten Schritt über den Vergleich mit 
einem SOFM, bei der die einzelnen latenten Faktoren im Gesamtmodell auf einen 
einzelnen Faktor zweiter Ordnung laden. Um die Stärke der einzelnen latenten 
Faktoren zu ermitteln, wird deren Varianz im SOFM auf Signifikanz getestet, 
selbst wenn dieses Modell eine schlechtere Anpassungsgüte zeigt als das СЕМП. 

Mit Blick auf die vier Dimensionen des BDGS zeigt das SOFM, bei dem 
ein Faktor zweiter Ordnung auf die vier latenten Faktoren Wahrhaftigkeit, Wis- 
sensgewinn', individueller Nutzen sowie gesellschaftlicher Nutzen lädt, eine gute 
Anpassungsgüte (X?(50) = 53.415, р = .344; RMSEA = .016 [.000, .045]; TLI 
= .997). Im Vergleich der nicht-hierarchischen Modelle zeigt das SOFM jedoch 


12 Gignac und Kretzschmar (2017) schlagen weitergehend einen Test mittels des Koeffizi- 
enten Omega hierarchical subscale‘ (OmegaHS) vor, der das Verhältnis von Faktorvarianz 
zur Gesamtvarianz ermittelt und standardisiert, so dass Vergleiche zwischen latenten Fak- 
toren möglich sind. Diese weitergehende Betrachtung der spezifischen Faktorvarianz wird 
nachfolgend nicht ermittelt, da lediglich die dimensionale Verschiedenheit geprüft werden 
soll. 

13 Die unstandardisierte Faktorladung des Faktors zweiter Ordnung auf den Faktor Wissens- 
gewinn wurde auf 1 restringiert, wodurch diese Dimension als Referenzindikator festgelegt 
wird. Dies wird für alle nachfolgenden Modelle zur Prüfung der DV beibehalten. Angaben 
zur Modellgüte des SOFM werden nachfolgend nicht mehr gemacht, da dem CFM konzeptu- 
ell und datenanalytisch an dieser Stelle der Vorzug gegeben wird. Das SOFM wird lediglich 
zur Analyse der DV herangezogen. 
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einen höheren AIC-Wert!* (AAIC = 10.277), weshalb dem CFM nicht nur auf 
Grundlage der definitorisch abgeleiteten mehrdimensionalen Konzeption, sondern 
auch aus empirischer Sicht der Vorzug zu geben ist. An dieser Stelle richtet sich 
der Blick jedoch auf die Varianz der einzelnen Dimensionen des BDGS, die hier 
als latente Faktoren erster Ordnung vorliegen. Es zeigen sich signifikante Vari- 
anzen der Faktoren Genauigkeit (0? Genauigkeit = .268, S.E. = .065, p < .001), 
Wissensgewinn (о? Wissensgewinn = .360, S.E. = .068, p < .001) und individuel- 
ler Nutzen (07 tnd, Nutzen = -311, S.E. = .069, p < .001), jedoch nicht für den 
Faktor gesellschaftlicher Nutzen (02 Ges. Nutzen = .023, S.E. = .041, p = .577). 
Fiir letztere Dimension kann die DV im vorliegenden Sample nicht angenommen 
werden. Das bedeutet, dass die Bewertung des gesellschaftlichen Nutzens sich 
nicht ausreichend von den drei anderen Dimensionen unterscheidet. Allerdings 
weisen Simulationen von Sinharay (2010) darauf hin, dass bei hoch ausgeprägten 
allgemeinen Faktoren (hier der Faktor zweiter Ordnung) bis zu zehn Indikator- 
variablen notwendig sind, um die Signifikanz eines spezifischen Faktors erster 
Ordnung festzustellen. Mit Blick auf die gebotene Kürze der BDGS-Skala ist von 
dieser Erweiterung der Indikatoren jedoch im vorliegenden Fall aus forschungs- 
ökonomischen Gründen abzusehen. Die Prüfung der DV wird nachfolgend an der 
entsprechenden Stelle für die Erhebung 1.2 und Erhebung 1.3 wiederholt. 


9.1.7 Der Zusammenhang der BDGS-Skala mit der 
Bewertungsdimension Volumen 


Es ist nun im Rahmen der Validität der Messung des BDGS zu prüfen, inwieweit 
die vier Dimensionen der BDGS-Skala mit der Bewertungsdimension Volumen 
zusammenhängen. Dies wird auch als kriteriumsbezogene Validität bezeichnet 
(Bandalos, 2017). Die im Anhang 1 im elektronischen Zusatzmaterial doku- 
mentierte Messung zur Bewertung des Ausmaßes zielte darauf ab, zu erheben, 
inwiefern die Befragten eine weitreichende Datensammlung und -auswertung 
begrüßen. Zum latenten Faktor gehören hierbei die folgenden vier Indikatoritems: 
Bewertung Volumen (a = .905; DEV = .703) 


e Es ist gut, dass immer mehr digitale Daten ausgewertet werden. (X = .768, 
Referenzindikator) 


14 Zum AIC-Wert äußert Kline (2011): “The AIC and related indexes are generally used in 
SEM to select among competing nonhierarchical models estimated with the same data. Spe- 
cifically, the model with the smallest AIC value is chosen as the one most likely to replicate” 
(Kline, 2011, S. 220). 
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e Es ist gut, dass weltweit Unmengen von digitalen Daten gespeichert werden. 
(X = .831) 

e Es ist gut, so viele digitale Daten wie möglich zu speichern. (X = .883) 

e Es ist gut, so viele digitale Daten wie möglich auszuwerten. (№ = .867) 


Es steht zu erwarten, dass bei einem Glauben an die Genauigkeit und den Wis- 
sensgewinn der Daten sowie dem hieraus gezogenen individuellen Nutzen und 
gesellschaftlichen Nutzen eine positive Bewertung digitaler Datensammlung und 
-auswertung mit einhergeht. Dabei ist mithin zu priifen, ob die vier Dimensionen 
des BDGS positiv mit einer positiven Bewertung einer umfassenden Sammlung 
digitaler Daten korrelieren. 

Das Messmodell fiir diese Bewertungsdimension Volumen wurde nun zusam- 
men mit dem BDGS im CFM modelliert. Die CFA kommt zu einer plausiblen 
Lösung, zeigt jedoch mit Blick auf den signifikanten Chi-Quadrat-Test eine 
unzureichende Anpassungsgüte (X?(94) = 130.533, р = .008; RMSEA = .039 
[.021, .054]; TLI = .982). Auch hier haben die hoch miteinander korrelierten 
Indikatoren noch gemeinsam geteilte Varianz, die nicht durch die Modellpfade 
abgebildet wird, sondern in der gemeinsamen Varianz der kovariierenden Fehler- 
terme begründet ist. Diese können im Modell eben nicht frei variieren, da sie auf 
null restringiert sind. An dieser Stelle wird, da das Modell mit der Bewertungs- 
dimension Volumen vor allem Illustrationszwecken und der Prüfung der Validität 
dient, der konzeptuellen Modellspezifikation der Vorzug gegeben. Es zeigt sich 
mit Blick auf die Inter-Korrelationen der fiinf Dimensionen in Tabelle 9.4, dass 
die positive Bewertung der Sammlung und Auswertung von digitalen Daten hoch 
mit der Zustimmung zu den vier Dimensionen des BDGS korreliert. 


Tabelle 9.4 Korrelationsmatrix — Erhebung 1.1: Finales Modell BDGS mit Volumen 


Volumen | Genauigkeit | Wissensgewinn | Individueller Nutzen 
Volumen 1 
Genauigkeit LIE? 1 
Wissensgewinn .600*** | .828%** 1 
Individueller .702¥*** | .809%** .714%%% 1 
Nutzen 
Gesellschaftlicher | .795*** | 879% .832*** RE tie 
Nutzen 


Notizen. * р < .05, ** p < .01, *** p < .001 
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Je stärker zugestimmt wird, dass Daten ein genaues und objektives Verständnis 
der Welt ermöglichen, dass aus ihnen Wissen gewonnen und Nutzen gezogen 
wird, desto positiver wird eine umfangreiche Datenspeicherung und -auswertung 
bewertet. Dies spricht für die erwartete positive Valenz der Sichtweise auf die 
digitalen Daten im Rahmen des besprochenen Glaubenssystems und somit auch 
für die Validität der Messung des BDGS. 


9.1.8 Diskussion der Ergebnisse der Skalenkonstruktion 


Als erste Erkenntnis vorweg und es ist dabei nicht banal das festzustellen: Die 
befragten Personen haben sich in der überwiegenden Mehrheit zugetraut, die 
ihnen gestellten Fragen unabhängig der Dimensionszugehörigkeit der einzelnen 
Items zu beantworten, auch wenn die Möglichkeit bestand, die Ausweichkatego- 
rie „Kann ich nicht beantworten‘ auszuwählen. Dies wurde mit Blick auf die in 
Abschnitt 9.1.3 besprochenen Resultate dort jedoch nur von höchstens 6,3 % der 
Befragten bei Item GE3 („Digitale Daten ermöglichen ein objektives Verständnis 
der Wirklichkeit“) auch gewählt und lag unter diesem Wert für die anderen erfrag- 
ten Items. Das ist zwar keine vernachlässigbar geringe Anzahl an Personen, die 
in der Befragungssituation ein generelles oder zumindest partielles Nicht-Wissen 
angegeben haben. Man könnte jedoch genauso gut erwarten, dass sich eine noch 
höhere Anzahl an Personen keine Beantwortung der Fragen zutraut. Basierend auf 
dem Digitalindex 2018/2019 von Initiative D21 e. V. (2019) lässt sich die deut- 
sche Bevölkerung in ‚Digitale Vorreiter‘ (37 %), ‚Digital Mithaltende‘ (42 %) und 
‚Digital Abseitsstehende‘ (21 %) einteilen. Die Abseitsstehenden zeichnen sich 
durch einen geringen Zugang, geringe Kompetenz, wenig vielfältiges Nutzungs- 
verhalten und geringe Offenheit gegenüber digitalen Anwendungen aus. Hier 
ist eine hohe Quote von Non-Responses zu erwarten. Nun kann es sein, dass 
sich in den jeweiligen Stichproben weniger Personen dieser Gruppe sammeln 
und andere Subgruppen überrepräsentiert waren. Der Samplequalität und dem 
Zufall muss an dieser Stelle zumindest Rechnung getragen werden. Doch selbst 
wenn alle Befragten zu den Mitgliedern der als „Digitale Vorreiter“ definierten 
Gruppe entstammten, dann ist mit Blick auf die derzeitigen Zugangschancen und 
das Berührungspotential mit dem Phänomen Big Data (siehe Kapitel 3) in den 
Samples über alle Befragten hinweg ein Ausdruck des Selbstvertrauens in die 
Beantwortungsfähigkeit der gestellten Fragen zu erkennen, das nicht unerheblich 
ist. 
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Mit Blick auf die Verteilungswerte der Indikatoren der vier Dimensionen zeigt 
sich, dass eine variable Einschätzung bezüglich der Genauigkeit digitaler Daten 
sowie des hieraus gezogenen individuellen und gesellschaftlichen Nutzens besteht. 
Die Befragten haben hier im Mittel eine abwägende Wahrnehmung, die durch- 
aus eine kritische Sicht auf die vermeintliche Genauigkeit und Objektivität der 
Daten und hieraus gezogene Nutzengewinne offenbart, da diesen Eigenschaften 
der Daten nicht automatisch zugestimmt wird. Geht es jedoch um den Wissens- 
gewinn, so wird den jeweiligen Glaubenssätzen im Aggregat zugestimmt, die 
Überzeugungen von aus den digitalen Daten gewonnener Erkenntnis formulieren. 


9.1.9 Skalenanpassungen auf Basis von Erkenntnissen der 
ersten Erhebung der Skalenkonstruktion 


Die in den vorherigen Abschnitten angesprochene aus der ersten Erhebung 
gewonnene Erkenntnis ist, dass es nicht ganz unerheblich ist, eine „weiß nicht“- 
Option bei der Beantwortung der BDGS-Skala anzubieten — da ihre Frageitems 
zumindest in Teilen das Wissen und den Erkenntnisgewinn selbst betreffen. So 
wurde auch in Reviewerkommentaren zur Skala aus den nachfolgenden Erhebun- 
gen 2.1 und 2.2 der Wunsch geäußert, befragten Personen die Möglichkeit zu 
geben, Unsicherheit und Nicht-Wissen bezüglich des Erkenntnisgewinns gezielt 
anzugeben. 

Das Anbieten einer solchen „weiß nicht“-Option könnte nach Krosnick et al. 
(2001) bei einigen Befragten jedoch auch zu ‚Satisficing‘ führen. Satisficing 
bedeutet, es wird aus unterschiedlichen Gründen (Vermeidung kognitiver Arbeit, 
Vermeidung des persönlichen Eingeständnisses von Unwissenheit) keine bedeu- 
tungsvolle Antwort gegeben, was als Datenqualitätsverlust gewertet werden 
kann. Die Messung kognitiver Arbeit in der Vorbereitung einer Antwort und 
der Überzeugungsstärke, mit der die Antwort gegeben wurde, ist jedoch mit 
der vorliegenden Messung nur bedingt möglich. Die (Wieder-)Aufnahme einer 
Ausweichoption wurde für die nachfolgenden Erhebungen aufgrund geringer 
Auswahlhäufigkeit verworfen, wobei ihr Vorhandensein bei zukünftigen Einsät- 
zen der BDGS-Skala oder ähnlicher Messungen mit Blick auf Zielgruppe und 
Forschungsinteresse reflektiert werden sollte bspw. beim Einsatz der Skala bei 
älteren Befragten. 


156 9 Studie 1 - Durchführung der Skalenkonstruktion 


9.2 Validierung der Skalenkonstruktion in Erhebung 1.2 
und Erhebung 1.3 


Die zwölf Frageitems und die zugrunde liegende Modellstruktur aus Erhebung 
1.1 wurden anschließend in zwei Erhebungen validiert, die im Folgenden auch 
als Erhebung 1.2 und Erhebung 1.3 bezeichnet werden. Ziel dieser Validierung ist 
zu prüfen, ob Item- und Skaleneigenschaften sowie die Modellstruktur stabil sind 
und sich die BDGS-Skala über unterschiedliche Untersuchungskontexte hinweg 
einsetzen lässt. 

Zudem wurde in Erhebung 1.3 erneut die diskriminante Validität der einzelnen 
Dimensionen in den Fokus genommen, um zu erörtern, inwieweit die Präsentati- 
onsweise der BDGS-Skala einen Einfluss auf die Bearbeitung hat. Somit wurde 
dort neben einer zusätzlichen Validierung der Dimensionen und ihrer Items eine 
leicht veränderte Skalenpräsentation getestet, deren Ergebnisse mit Blick auf den 
zukünftigen Einsatz der Skala diskutiert werden. 


Erhebung 1.2 — Masterseminar Digitalisierungsfolgen 

Im Rahmen des MA-Seminars ‚Die dunkle Seite der Macht: Risiken der Digi- 
talisierung‘ im Sommersemester 2017 und im Wintersemester 2017/2018 am 
Institut für Kommunikationswissenschaft in Münster bestand die Möglichkeit für 
eine Validierung der Skala mit einem repräsentativen Sample. Ziel des Seminars 
war die Untersuchung der Wahrnehmung von Privatheitsrisiken in der deutschen 
Online-Bevölkerung mit Blick auf die drei Digitalisierungskontexte E-Commerce, 
politische Online-Kommunikation und Self-Tracking. Das Sample wurde daher 
aufgeteilt, so dass je eine Teilgruppe zu einem der drei Anwendungsfälle befragt 
wurde. Weitere Informationen zu dieser zur Publikation angenommenen Studie 
finden sich bei Lünich et al. (2021) und bei Klinger et al. (2018). 


Erhebung 1.3. — Open Data 

In Kooperation mit Dr. Christian Wiencierz vom Institut für Kommunikations- 
wissenschaft in Münster wurde im Jahr 2018 ein Forschungsprojekt zu Open 
Data durchgeführt, das von der Deutschen Gesellschaft für Online-Forschung 
e. У. (ОСОБ) finanziell gefördert wurde. Ziel des Projekts war es, die Frage zu 
beantworten, inwiefern explizite Hinweise auf eingehaltenen Datenschutz und die 
darüberhinausgehende Selbstverpflichtung zur Einhaltung ethischer Leitlinien im 
Umgang mit personensensiblen Daten durch Plattformbetreibende einen Einfluss 
auf das Vertrauen der Plattform-Nutzenden haben. Um zu testen, welchen Einfluss 
die Menge an bereitgestellten Informationen auf das entgegengebrachte Ver- 
trauen hat, wurde eine Online-Befragung mit Experimentaldesign durchgeführt. 
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In diesem bekamen die Teilnehmer*innen eine eigens für das Projekt pro- 
grammierte Webseite eines fiktiven kommerziellen Open-Data-Plattformanbieters 
gezeigt, die jeweils unterschiedlich viele Hinweise (a) zum Datenschutz und (b) 
zu den ethischen Leitlinien im Umgang mit personensensiblen Daten bereithielt. 
Anschließend wurden sie zu ihrer Wahrnehmung des Anbieters und seiner Ver- 
trauenswürdigkeit befragt. Weitere Informationen finden sich bei Wiencierz und 
Lünich (2020). 


Bedeutung der Erhebung 1.3 für die Skalenkonstruktion 

Neben der erneuten Validierung der Modellstruktur wurde die dritte Erhebung 
zur Skalenkonstruktion dazu genutzt, den Einfluss der Präsentationsweise der 
BDGS-Skala auf die diskriminante Validität zu untersuchen. Die Ergebnisse der 
Erhebung 1.1 indizieren, dass es aufgrund der hohen Inter-Korrelation der latenten 
Faktoren im CFA-Modell mitunter fraglich ist, ob überhaupt von diskriminanter 
Validität ausgegangen werden kann. Ein Grund für die hohen Korrelationswerte 
könnte darin liegen, dass die Präsentationsweise der BDGS-Skala mit den zwölf 
Frageitems auf einer Seite zu sogenannten Reihenfolgeeffekten auf Seiten der 
Befragten führt (Scholl, 2018). Es wäre bspw. ein Konsistenzeffekt zu beobach- 
ten, wenn die Beantwortung der ersten präsentierten Frage einen Einfluss auf die 
Beantwortung der nachfolgenden Frageitems hat. Es käme womöglich zu einem 
Auseinanderfallen der vom Befragten erwarteten oder ‚geratenen‘ Dimensionie- 
rung und der konzeptuellen sowie mutmaßlich empirischen Dimensionierung. 
Aufgrund der Rotation der Fragebogenitems auf der Seite befand sich zwar 
immer eine andere der insgesamt zwölf Aussagen am Anfang der jeweiligen 
Skala, es könnten jedoch auch der Gesamteindruck der Skala und die von den 
Befragten erwartete Zusammengehörigkeit der Items zu einem allgemeinen Test 
einen kognitiven Befragungseffekt auslösen. Die Befragten würden dann erwar- 
ten, dass die Items — unabhängig von der konkreten Formulierung — alle in eine 
bestimmte Richtung abzielen, so dass man auch alle Items ähnlich beantworten 
müsse. Scholl (2018) merkt hierzu Folgendes an: 


Zu vermeiden sind solche Kontexteffekte nicht, es sei denn, man verzichtet darauf, 
mehrere Fragen zum gleichen Thema zu stellen. Eine andere Möglichkeit besteht 
darin, die Fragen zu trennen und an unterschiedlichen Stellen im Fragebogen abzufra- 
gen. Allerdings gefährdet diese Maßnahme die Stringenz der Befragung. Außerdem 
ist ihre Wirkung zweifelhaft, weil das Gedächtnis des Befragten durch die Folge- 
frage(n) reaktiviert wird. Wenn bekannt ist, wie Kontexteffekte funktionieren, kann 
man sie je nach Forschungsziel nutzen. (S. 217) 
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Um erste Erkenntnisse über eben jene Kontexteffekte auf die Beantwortung der 
BDGS-Skala zu gewinnen und zu prüfen, inwieweit die Präsentation der BDGS- 
Skala einen Einfluss auf die diskriminante Validität hat, wurde die Skala im 
vorliegenden Fragebogen aufgeteilt: Die Frageitems der Dimensionen Genau- 
igkeit und Wissensgewinn fanden sich auf einer gemeinsamen Seite und die 
der Dimensionen zum individuellen und gesellschaftlichen Nutzen nach ein paar 
dazwischengeschobenen Fragenblöcken ein paar Seiten später gemeinsam auf 
einer Seite. Auch wenn die beiden Nutzendimensionen hoch miteinander kor- 
relieren, wurde davon abgesehen, gerade die thematisch ähnlichen Dimensionen 
auf unterschiedliche Seiten aufzuteilen. Grund hierfür war, Irritationen auf Seiten 
der Befragten zu vermeiden, die durch mögliche mangelnde Unterscheidungsfä- 
higkeit von auf mehreren Seiten aufgeteilten Fragen zum epistemischen Charakter 
der Daten und dem hieraus gezogenen Nutzen hervorgerufen werden könnte. Eine 
direkte Kontrastierung erschien bei diesen Dimensionen geboten. 


9.2.1 Feldphasen und Sample 


Erhebung 1.2 Feldphase, Sample und Fragebogenaufbau 

Die Feldphase der Befragung in Erhebung 1.2 lief vom 5. bis zum 13. Dezem- 
ber 2017. Die Rekrutierung der Befragten erfolgte erneut durch die Respondi 
AG, die hierzu auf ihr Online-Access-Panel zugriff. Die Teilnehmer*innen der 
Untersuchung, die durch eine Vergütung für ihre Teilnahme incentiviert wur- 
den, wurden nach Geschlecht, Alter (ab 14 Jahre) und Bildungsniveau quotiert 
auf Grundlage der aktuellen Zusammensetzung der deutschen Bevölkerung mit 
Onlinezugang, womit das Sample repräsentativ für diese Population ist (Arbeits- 
gemeinschaft Online Forschung – agof, 2017). Es wurden 9266 Personen aus dem 
Panel eingeladen. Insgesamt wurde der Fragebogen 1921-mal aufgerufen. Mit der 
Beantwortung begannen 1807 Befragte, wovon wiederum 1320 Befragte den Fra- 
gebogen beendeten und die letzte Fragebogenseite erreichten. Die Antwortrate lag 
somit bei 14,2 %. 

Insgesamt wurden also n = 1320 Personen befragt, für die vollständig aus- 
gefüllte Fragebögen vorlagen. Im Anschluss an die Datenerhebung wurde der 
Datensatz bereinigt. Dabei wurden, wie in Abschnitt 9.1.2 dokumentiert, auch 
hier Befragte von der Auswertung ausgeschlossen, die auffällig schnell durch 
den Fragebogen geklickt haben. Die Zeit für den Screenout lag hier bei weni- 
ger als 7 Minuten und 34 Sekunden; die Zeit, die man nach internen Tests in 
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der Projektgruppe mindestens benötigte, um alle Fragen gewissenhaft zu bearbei- 
ten. Das finale Sample enthält mithin n = 1114 Fälle und setzt sich wie folgt 
zusammen: Männer und Frauen waren in ungefähr gleichen Anteilen vertreten 
(50,7 % männlich, 49,3 % weiblich). Im Durchschnitt waren die Befragten 45 
Jahre alt (SD = 15,54). Knapp 29,8 % der Untersuchungsteilnehmer*innen wie- 
sen eine niedrige Bildung auf (Volks- oder Hauptschule), 33,7 % eine mittlere 
Bildung (mittlere Reife) sowie 36,5 % eine hohe Bildung (mindestens Hoch- 
schulreife oder Hochschulabschluss). Die Verteilung der drei Teilstichproben war 
annähernd gleich (E-Commerce: п = 372, 33,4 %; Politische Online-Partizipation: 
п = 375, 33,7 %; Self-Tracking: п = 367, 32,9 %).!° 

Die BDGS-Skala fand sich in der Mitte des Fragebogens auf der zwölften 
von 23 Seiten (siehe Fragebogen im Anhang 3.2 im elektronischen Zusatzmate- 
rial). Die Frageitems der BDGS-Skala wurden rotiert, so dass die Reihenfolge der 
gezeigten Aussagen jeweils zufällig festgelegt wurde. Die drei untersuchten Kon- 
texte wurden vor der Beantwortung der BDGS-Skala eingeführt und jeweils mit 
einem eigenen Einleitungstext erklärt. Da es in den drei Kontexten explizit um die 
Sammlung und Auswertung privater digitaler Daten ging, ist es wahrscheinlich, 
dass bedingt durch diesen geteilten Fragebogenaufbau jeweils Befragungsef- 
fekte bei der Beantwortung der BDGS-Skala zu erwarten sind. Deshalb werden 
nachfolgend für die Kontexte E-Commerce (nachfolgend Erhebung 1.2a), politi- 
sche Online-Kommunikation (Erhebung 1.2b) und Self-Tracking (Erhebung 1.2c) 
die jeweiligen Kennwerte für Indikatoren und Messmodelle gesondert berichtet, 
jedoch jeweils gemeinsam besprochen. 

Der Aufbau und die Formulierungen der BDGS-Skala blieben identisch zu 
Erhebung 1.1, wobei nur noch 18 Items gezeigt wurden. Dazu zählen die zwölf 
Items der vier Dimensionen Genauigkeit, Wissensgewinn, individueller Nutzen 
und gesellschaftlicher Nutzen sowie jeweils drei Items zur Bewertung des Aus- 
maßes (Volume) und der Geschwindigkeit (Velocity) der Datenspeicherung und 
-auswertung. Letztere werden in der vorliegenden Arbeit jedoch aus oben genann- 
ten Gründen nicht weiter berücksichtigt. Zudem wurde die Ausweichoption „weiß 
nicht“ ab Erhebung 1.2 für alle BDGS-Items gestrichen, so dass nur noch eine 
Verortung auf der siebenstufigen Beantwortungsskala möglich war. 


15 Die Befragten wurden mittels ‚Urnenziehung ohne Zurücklegen‘ einer der drei Befra- 
gungskonditionen zugelost. 
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Erhebung 1.3 — Feldphase, Sample und Fragebogenaufbau 

Die Feldphase der Befragung lief vom 5. bis zum 12. Juni 2018. Die Rekrutierung 
der Befragten erfolgte auch hier durch die Respondi AG, die hierzu auf ihr Online- 
Access-Panel zugriff. Die Teilnehmer*innen der Untersuchung, die durch eine 
Vergütung für ihre Teilnahme incentiviert wurden, wurden zufällig gezogen. Es 
wurden 2767 Einladungen an das Panel versendet. Insgesamt wurde der Fragebo- 
gen 1364-mal aufgerufen. Mit der Beantwortung begannen 1288 Befragte, wovon 
wiederum 836 Befragte den Fragebogen beendeten und die letzte Fragebogen- 
seite erreichten. Die Antwortrate lag somit bei 30,2 %. Hierbei ist anzumerken, 
dass kurz vor Ende der Befragung ein Attention-Check eingebaut wurde, der 
die Befragten aufforderte, bei einem Item in der Fragebatterie einen bestimmten 
Skalenpunkt anzukreuzen. 209 Personen kreuzten hier falsch und wurden ohne 
Vergütung zum Panelanbieter zurückgeleitet, da anzunehmen ist, dass sie nicht 
alle Fragen aufmerksam und gewissenhaft gelesen und bearbeitet haben. 

Insgesamt wurden also n = 836 Personen befragt, für die vollständig aus- 
gefüllte Fragebögen vorlagen. Im Anschluss an die Datenerhebung wurde der 
Datensatz bereinigt. Dabei wurden auch hier Befragte von der Auswertung aus- 
geschlossen, die auffällig schnell durch den Fragebogen geklickt haben. Die Zeit 
für den Screenout lag hier bei weniger als 2 Minuten und 30 Sekunden, also 
mindestens zwei Standardabweichungen weniger als die durchschnittliche Beant- 
wortungszeit von 11 Minuten und 27 Sekunden. Dies traf jedoch nur auf einen 
Fall zu. Zudem wurden Befragte von der Datenanalyse ausgeschlossen, bei denen 
nicht sichergestellt werden konnte, dass der Fragebogen technisch einwandfrei 
funktioniert hat (n = 19). Schließlich wurden Befragte ausgeschlossen, die entge- 
gen der ihnen zugewiesenen Experimentalkondition angaben, keine Informationen 
zum Datenschutz (n = 9) oder zu den ethischen Leitlinien im Umgang mit perso- 
nensensiblen Daten (n = 3) gesehen zu haben. Das finale Sample enthält mithin 
n = 784 Fälle und setzt sich wie folgt zusammen: Männer und Frauen waren in 
etwa gleichen Anteilen vertreten (48,9 % männlich, 51,5 % weiblich). Im Durch- 
schnitt waren die Befragten 47,7 Jahre alt (SD = 14,52). Knapp 13,3 % der 
Untersuchungsteilnehmer*innen wiesen eine niedrige Bildung auf (Volks- oder 
Hauptschule), 35,2 % eine mittlere Bildung (mittlere Reife) sowie 51,1 % eine 
hohe Bildung (mind. Hochschulreife oder Hochschulabschluss). Damit ist das 
Sample etwas höher gebildet als in Erhebung 1.2. 

Die Frageitems der BDGS-Skala fanden sich mit Genauigkeit und Wissensge- 
winn auf Seite 3 und individueller und gesellschaftlicher Nutzen auf Seite 7 (siehe 
Fragebogen im Anhang 3.3 im elektronischen Zusatzmaterial). Auf den drei Sei- 
ten dazwischen fanden sich Fragen zu informationellen Privatheitsbedenken bei 
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der Internetnutzung, der Intensität der Online- und Smartphone-Nutzung sowie 
der Intensität der Nutzung von Medienberichterstattung über die Digitalisierung. 


9.2.2 Datenauswertung und Ergebnisse 


Die Datenauswertung der Erhebungen 1.2 und 1.3 folgt der Modellspezifikation 
des Gesamtmodells des BDGS aus Erhebung 1.1 (siehe Abbildung 9.2) und dem 
in Abschnitt 9.1.3 beschrieben Vorgehen bei der Datenanalyse mit AMOS 23. 

Alle Modelle wurden erneut mit der FIML-Schätzung geschätzt. Die Mit- 
telwerte der latenten Faktoren wurden erneut auf den Wert null restringiert, so 
dass die Achsenabschnitte (Regressionskonstanten) aller beobachteten Indikatoren 
geschätzt werden konnten. 

Die Datenauswertung für Erhebung 1.2 greift zudem die Logik der Kon- 
textunterscheidung in der Untersuchungsanlage auf und berichtet nachfolgend 
die Ergebnisse für jeweils eine CFA für das Szenario E-Commerce, politische 
Online-Partizipation und Self-Tracking. 

Die CFA für das jeweils identisch spezifizierte Modell kommt in allen drei 
Kontexten der Erhebung 1.2 zu einer plausiblen Lösung. Im Sinne der ein- 
fachen Vergleichbarkeit der drei Kontexte finden sich die jeweiligen Werte 
für die drei CFAs in den folgenden Tabellen nebeneinander abgetragen. Es 
zeigt sich mit Blick auf die in Tabelle 9.5 berichteten Fit-Maße, dass der 
strenge Chi-Quadrat-Test jeweils eine unzureichende Anpassungsgüte zeigt, die 
inkrementellen Fit-MaBe des RMSEA und der TLI jedoch jeweils eine hohe 
Anpassungsgüte indizieren. Auch für diese Modelle würden freizusetzende Kor- 
relationen der Fehlerterme den Modellfit jeweils verbessern, diese folgen jedoch 
mit Blick auf die Modifikationsindizes und gemeinsam geteilte Varianz keiner 
Systematik. 

Die CFA für das spezifizierte Modell kommt auch für das Sample der Erhe- 
bung 1.3 zu einer plausiblen Lösung und zeigt mit Blick auf den strengen 
Chi-Quadrat-Test eine unzureichende Anpassungsgüte (X?(48) = 136.608, p < 
.001; RMSEA = .049 [.039, .058]; TLI = .981). Der RMSEA und der TLI indi- 
zieren jedoch eine ausreichend hohe Anpassungsgüte. Auch für dieses Modell 
würden freizusetzende Korrelationen der Fehlerterme den Modellfit jeweils ver- 
bessern. Zudem ist hier ebenfalls zu bedenken, dass das vorliegende Modell 
bei ganzen 784 Beobachtungen zu einem signifikanten Chi-Quadrat-Test tendiert 
(siehe hierzu Abschnitt 9.1.3). 
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Tabelle 9.5 Fit-Maße des BDGS-Modell (CFM) – Erhebung 1.2 


Erhebungskontext RMSEA (LO90; HI90) 

Erhebung 1.2a 103.835*** .056 (.041; .071) .980 372 
— E-Commerce 

Erhebung 1.2b — Pol. 92.037*** .050 (.034; .065) .985 375 
Online-Kommunikation 

Erhebung 1.2c 102.060*** ‚055 (.040; .070) 981 367 
— Self-Tracking 


Notizen. * р < .05, ** p < .01, *** p < .001 


In Tabelle 9.6 finden sich die jeweiligen Angaben zum Cronbachschen o und 
der DEV der jeweiligen Dimensionen in Erhebung 1.2 und 1.3. Die Werte indi- 
zieren fiir alle Modelle tiber alle vier Dimensionen hinweg eine hohe interne 
Konsistenz. 

Darüber hinaus finden sich in der Tabelle 9.7 für Erhebung 1.2 und Tabelle 9.8 
für Erhebung 1.3 jeweils die Regressionskonstanten, die Regressionswerte sowie 
die geschätzten Faktorladungen der einzelnen Indikatoren samt deren Dimensi- 
onszugehörigkeit innerhalb des BDGS. Es zeigt sich, wie auch in Erhebung 1.1, 
dass die Regressionskonstanten für die Indikatoren der Dimensionen Genauigkeit, 
individueller Nutzen und gesellschaftlicher Nutzen nahe dem Skalenmittelpunkt 
liegen. Für die Indikatoren der Dimension des Wissensgewinns hingegen liegen 
die Regressionskonstanten in der Erhebung 1.2 rund einen halben Skalenpunkt 
oberhalb der Skalenmitte, in Erhebung 1.3 sogar einen ganzen Skalenpunkt. 

In Tabelle 9.9 finden sich die Inter-Korrelationen der vier Dimensionen des 
BDGS in den Erhebungen 1.2 und 1.3, die erneut hoch miteinander korrelieren. 
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Tabelle 9.8 Kennwerte Dimensionen und Indikatoren — Erhebung 1.3: Modell BDGS 
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Item-ID |Itemformulierung „Digitale | B (SE) В (SE) A 

Daten ...“ 
Genauigkeit 

GE1 ... ermöglichen ein genaues | 4.403 (.048) |18 ‚895 
Verständnis der Welt. 

GE2 ... ermöglichen ein exaktes |4.147 (.051) |.992*** (.033) .832 
Verständnis der Welt. 

GE3 ... ermöglichen ein 4.205 (.048) | .887*** (.033) .797 
objektives Verständnis der 
Wirklichkeit. 

Wissen 

Wi ... verhelfen zu neuem 5.161 (.045) |1? .874 
Wissen. 

W2 ... führen zu neuen Fakten. | 4.797 (.045) | .865*** (.035) 759 

Wi ... verhelfen zu neuen 5.096 (.043) | .967*** (.030) .896 
Erkenntnissen. 

Individueller Nutzen 

ІМІ ... erzeugen für mich 3.978 (.045) |1 ‚833 
persönlich einen Mehrwert. 

IN2 ... führen für mich zu 4.065 (.042) |.924*** (.035) 821 
Vorteilen. 

IN3 ... haben für mich 3.995 (.041) | .898*** (.035) 823 
persönlich positive 
Auswirkungen. 

Gesellschaftlicher Nutzen 

GNI ... erzeugen einen Mehrwert | 4.172 (.039) | 14 .868 
für die Gesellschaft. 

GN2 ... führen zu 4.102 (.038) |.886*** (.034) .782 
gesellschaftlichen Vorteilen. 

GN3 ... sind ein 4.129 (.040) | 1.000*** (.034) |.852 


gesellschaftlicher Gewinn. 


Notizen. * Referenzindikator; * p < .05, ** р < .01, *** p < .001 
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Tabelle 9.9 Korrelationsmatrix — Erhebung 1.2 und 1.3: Finales Modell BDGS 


Genauigkeit | Wissensgewinn | Individueller | Gesellschaftlicher 
Nutzen Nutzen 

Genauigkeit 

Erhebung 1.2a 1 .817*** Вот 895*** 

— E-Commerce 

Erhebung 1.26 - Pol. | 1 761 *** Kik 888*** 

Online- 

Kommunikation 

Erhebung 1.2c 1 .819*** 784*** 895*** 

— Self-Tracking 

Erhebung 1.3 1 БОРЛЫ S12*** .528*** 
Wissensgewinn 

Erhebung 1.2a 1 790*** .807*** 

— E-Commerce 

Erhebung 1.26 — Pol. 1 756*** 853*** 

Online- 

Kommunikation 

Erhebung 1.2c 1 Зи 853*** 

— Self-Tracking 

Erhebung 1.3 1 458*** tege 
Individueller Nutzen 

Erhebung 1.2a 1 .947*** 

— E-Commerce 

Erhebung 1.2b — Pol. 1 886*** 

Online- 

Kommunikation 

Erhebung 1.2c 1 .901*** 

— Self-Tracking 

Erhebung 1.3 1 .877*** 


Notizen. * p < .05, ** p < .01, *** p < .001 


Prüfung auf Messinvarianz 

Als Voraussetzung für die Vergleichbarkeit der Messung einzelner Erhebungen 
muss zunächst die Messinvarianz (synonym auch als Messäquivalenz bezeichnet) 
des Gesamtmodells überprüft werden, also, ob und inwieweit sich die Bezie- 
hungsstruktur des Messmodells für die vorliegenden Stichproben unterscheidet 
(van de Schoot et al., 2012; Weiber & Mühlhaus, 2014). Nur bei Messäquiva- 
lenz kann davon ausgegangen werden, dass die latenten Faktoren das gleiche 
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Konstrukt messen und sinnvoll miteinander verglichen werden können (Wida- 
man & Reise, 1997). Dabei gibt es der Ausarbeitung von Weiber und Mühlhaus 
(2014) folgend unterschiedliche Grade an Messinvarianz: Konfigurale Messin- 
varianz bedeutet, dass das spezifizierte Modell über die verglichenen Gruppen 
hinweg eine gleich hohe Anpassungsgüte besitzt und indiziert einen schwachen 
Grad faktorieller Invarianz. Metrische Messinvarianz bedeutet, dass die Stärke des 
Zusammenhangs zwischen Indikator und latentem Konstrukt über die vergliche- 
nen Gruppen hinweg identisch ist und wird auch als mittlerer Grad faktorieller 
Invarianz bezeichnet. Ein starker Grad faktorieller Invarianz liegt weiterhin vor, 
wenn bei gleicher Ausprägung des Konstrukts auch die Regressionskonstanten 
aller Indikatoren gleich ausfallen. Nur bei starker faktorieller Messinvarianz kön- 
nen die Mittelwerte der latenten Faktoren über die Gruppen hinweg verglichen 
werden. Zudem kann noch auf strikte faktorielle Invarianz geprüft werden, für 
die von einer Invarianz der Messfehler ausgegangen wird. 

Für die drei Erhebungen 1.1, 1.2 und 1.3 wurde eine entsprechende Prüfung 
durchgeführt. Die Ergebnisse in Tabelle 9.10 zeigen, dass mit Blick auf den 
Chi-Quadrat-Differenztest die Modelle mit metrischer und skalarer Invarianz eine 
signifikant schlechtere Anpassungsgüte zeigen. Allerdings gibt es Hinweise dar- 
auf, dass auch im Rahmen der Prüfung auf Messinvarianz die Stichprobengröße 
(hier n = 2153) sowie die Anzahl der verglichenen Gruppen sowie die Größe 
des geschätzten Modells dahingehend einen Einfluss auf den Test auf Messinva- 
rianz haben, als dass der strenge Chi-Quadrat-Differenztest schnell dazu tendiert 
ein signifikantes Ergebnis zu erbringen (Putnick & Bornstein, 2016). Mithin wer- 
den auch hier häufig inkrementelle Fit-Maße zur Beurteilung der Messinvarianz 
herangezogen (F. F. Chen, 2007; Meade et al., 2008), die eine Einschätzung 
erlauben, in welchem Grad sich das Modell durch die Gleichheitsrestriktionen 
verschlechtert. 
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So wird mit Blick auf Tabelle 9.10 ersichtlich, dass das Modell mit der 
skalaren Invarianz bezüglich der inkrementellen Fit-Maße des TLI und des 
RMSEA eine höhere bzw. mindestens gleich hohe Anpassungsgüte zeigt, ver- 
glichen mit den Modellen mit konfiguraler Invarianz bzw. metrischer Invarianz. 
Das bedeutet, dass das Modell mit den Gleichheitsrestriktionen eine signifikant, 
jedoch nicht substantiell schlechtere Anpassungsgüte zeigt und mithin von starker 
Messinvarianz ausgegangen wird. 

Durch die Festsetzung der Gleichheitsrestriktionen lassen sich bei starker Mes- 
sinvarianz die Mittelwerte der latenten Konstrukte über die Gruppen hinweg 
vergleichen, wobei die Stichprobe der Erhebung 1.1 als Referenzgruppe festgelegt 
wird, deren Faktor-Mittelwerte auf О restringiert sind (siehe Tabelle 9.11). 

Es zeigt sich mit Blick auf die Mittelwerte, dass für alle Dimensionen des 
BDGS kein Unterschied zwischen den Erhebungen 1.1 und 1.2 besteht, die Mit- 
telwerte der Dimensionen in Erhebung 1.3 jedoch signifikant höher ausfallen als 
in Erhebung 1.1 und in Teilen auch als in der Erhebung 1.2. 


Prüfung der dimensionalen Verschiedenheit 
Wie im Rahmen der Erhebung 1.1 diskutiert, stellt sich die Frage der DV. Daher 
wurde zur erneuten Prüfung der DV auch in Erhebung 1.2 sowie Erhebung 1.3 
ein SOFM spezifiziert, das Aussagen über die spezifische Varianz der latenten 
Faktoren erlaubt. 

Für alle drei Kontexte in Erhebung 1.2 zeigen sich signifikante Varianzen der 
Faktoren 


® Genauigkeit (о? Genauigkeit_1.2a = .263, SE = .048, р < .001; о? Genauigkeit_1.2b 
= .348, SE = .051, р < .001; о Genauigkeit_1.2c = .345, S.E. = .062, p < .001), 

e Wissensgewinn (0?Wissensgewinn_1.2a = .377, SE = .055, p < .001; 
© Wissensgewinn_1.2b = .398, SE = .055, p < .001; О Wissensgewinn_1.2c = .385, 
S.E. = .053, p < .001), 

© Individueller Nutzen (07 tna. Nutzen 12a = .153, SE = .041, р < .001; 
о. Nutzen_1.2b = -391, SE = .054, р < .001; Sa Nutzen_1.2c = .454, S.E. = 
.063, р < .001). 
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Die Varianz des Faktors gesellschaftlicher Nutzen ist jedoch in allen drei 
Kontexten nicht signifikant (о? Ges. Mutzen 12a = .055, SE = .032, р = .088; 
02 Ges. Nutzen_1.2b = .006, SE = .032, р = .854; «2б, Nutzen_1.2c = -.003, S.E. 
= .036, р = .932).16 

Auch in Erhebung 1.2 indizieren die Ergebnisse daher, dass sich mit Blick auf 
die DV die Dimensionen Genauigkeit, Wissensgewinn und individueller Nutzen 
voneinander unterscheiden lassen, die Bewertung des gesellschaftlichen Nutzens 
sich jedoch nicht ausreichend von den drei anderen Dimensionen innerhalb des 
BDGS unterscheidet (Gignac & Kretzschmar, 2017). 

Daher wurde zur erneuten Prüfung der DV in Erhebung 1.3 ebenfalls ein 
SOFM spezifiziert, das Aussagen über die spezifische Varianz der latenten Fakto- 
ren erlaubt. Es zeigen sich hier signifikante Varianzen der Faktoren Genauigkeit 
(0? Genauigkeit = .898, S.E. = .068, p < .001), Wissensgewinn (0?Wwissensgewinn = 
.852, S.E. = .062, p < .001), individueller Nutzen (07 tnd. Nutzen = .176, S.E. = 
.033, p < .001) sowie, anders als bei den Erhebungen 1.1 und 1.2 zuvor, auch 
des gesellschaftlichen Nutzens (02 Ges. Nutzen = -115, S.E. = .026, p < .001). Die 
Varianz der Nutzendimensionen fällt jedoch im Vergleich mit den anderen beiden 
Dimensionen trotz Signifikanz deutlich geringer aus und begründet sich auch in 
der größeren Stichprobe. 

An dieser Stelle der Skalenkonstruktion erfolgt daher folgendes Fazit bezüg- 
lich der dimensionalen Struktur des Modells: Einem CFM mit Korrelationen zwi- 
schen den vier latenten Faktoren wird der Vorzug vor einem Single-Factor-Modell 
oder einem Second-Order-Factor-Modell gegeben. Die einzelnen Dimensionen 
lassen sich als eigenständige latente Faktoren identifizieren und voneinander 
unterscheiden, auch wenn es leichte Einschränkungen mit Blick auf die Stärke 
der dimensionalen Verschiedenheit gibt. Bei ausgeprägtem BDGS variieren die 
Befragten stärker mit Blick auf ihre Einschätzungen der Wahrhaftigkeitsdimen- 
sionen als mit Blick auf den wahrgenommenen Nutzen. 


Die Prüfung von Reihenfolgeeffekten auf die Diskriminanzvalidität 

Explizites Ziel der Erhebung 1.3 war zudem die Prüfung von Reihenfolgeeffek- 
ten auf die Diskriminanzvalidität der latenten Faktoren. Die Inter-Korrelationen 
zwischen den latenten Faktoren in den Erhebungen 1.1 und 1.2 erreichten in 
Teilen so hohe Werte, dass gemäß dem Fornell-Larcker-Kriterium keine Dis- 
kriminanzvalidität festgestellt werden konnte. Durch eine Aufteilung der Skala 


16 Die Varianz des latenten Faktors in Kontext 1.2c ist negativ, so dass es aufgrund dieses 
Heywood Cases (siehe Abschnitt 9.1.3) zu einer unzulässigen Lösung des Schätzalgorithmus 
im SOFM kommt. 
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auf zwei Befragungsseiten sollte der Einfluss der Skalenpräsentation auf einer 
Seite geprüft werden, wobei zwischen den beiden Seiten der nun aufgeteilten 
Skala weitere Itembatterien positioniert wurden, um einen Ablenkungseffekt zu 
erzielen. 

Zunächst richtet sich der Blick auf die Dimension Genauigkeit und 
deren quadrierte Korrelation mit der Dimension des individuellen Nutzens 
(т? Genauigkeit, individueller Nutzen = .262) und der Dimension des gesellschaftlichen 
Nutzens (T? Genauigkeit, gesellschaftlicher Nutzen = .279). Die in Tabelle 9.6 berichtete 
DEV der Faktoren zeigt nun deutlich, dass von diskriminanter Validität ausge- 
gangen werden kann, da die jeweilige DEV größer als die gemeinsam geteilte 
Varianz der Faktoren ist. Schaut man auf die Dimension Wissensgewinn und 
individueller Nutzen ae, individueller Nutzen = -210) und gesellschaftli- 
cher Nutzen ларда, gesellschaftlicher Nutzen = .228), fallen die Werte für die 
quadrierten Korrelationen ebenfalls deutlich niedriger aus als jeweils beide DEV- 
Werte. Vergleicht man gemeinsam geteilte Varianz der latenten Faktoren, die sich 
auf unterschiedlichen Fragebogenseiten befanden, mit denen aus Erhebung 1.1 
(siehe Tabelle 9.3) und Erhebung 1.2 (siehe Tabelle 9.9), die auf einer Seite 
angezeigt wurden, so lässt sich rund die Hälfte bis zwei Drittel der Varianz durch 
den Reihenfolgeeffekt erklären. 


9.2.3 Diskussion der Ergebnisse 


Die Anpassungsgüte des BDGS-Modells wird auch in den beiden Erhebun- 
gen 1.2 und 1.3 der Studie 1 als ausreichend bis zufriedenstellend bewertet. 
Zwar verfehlt die Modellierung des BDGS in beiden Erhebungen den strengen 
Chi-Quadrat-Test. Dennoch wurde auf Grundlage der vorliegenden Konzeption 
die Freisetzung der restringierten Parameter, also die Zulässigkeit korrelier- 
ter Fehlerterme, vermieden, da die inkrementellen Fit-Maße eine gute Passung 
indizieren. 


Erhebung 1.2 

Die Mittelwerte der Dimensionen des BDGS zeigen im Vergleich der Erhebung 
1.1 mit der Erhebung 1.2 über alle drei Kontexte einen ähnlichen Gesamtein- 
druck. Diese Ähnlichkeit der Resultate führt zu der Einschätzung, dass die 
Messung des BDGS mit dem vorgeschlagenen Skalen-Instrument zum einen relia- 
bel möglich ist und die in Erhebung 1.1 gewählten Indikatoren insgesamt geeignet 
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sind, die konzeptuelle Dimensionierung abzubilden. Zum anderen indizieren die 
Ergebnisse, dass das BDGS als ein stabiles Wahrnehmungsmuster erscheint. Die 
Ausprägung der Dimensionen zeigt, dass mit Blick auf die Genauigkeit der Daten 
sowie auf den hieraus gezogenen individuellen und gesellschaftlichen Nutzen von 
den Befragten durchaus abgewogen und im Durchschnitt keine eindeutig negative 
oder positive Bewertung abgegeben wird. Die Einschätzung der Datensamm- 
lung und -auswertung ist mithin durchaus ambivalent, während die Befragten 
durchweg einen Wissensgewinn aus den Daten erwarten. 


Erhebung 1.3 

Die Ähnlichkeit der Resultate von Erhebung 1.3 führt auch hier zunächst zu der 
Einschätzung, dass die Messung des BDGS mit dem vorgeschlagenen Skalen- 
Instrument reliabel möglich ist und die gewählten Indikatoren geeignet sind, die 
konzeptuelle Dimensionierung abzubilden. Es zeigt sich mit Blick auf die erste 
Forschungsfrage (siehe Kapitel 7), die danach fragt, inwieweit sich ein Glaube 
an digitale Daten in seinen mehrdimensionalen Bezugspunkten von Überzeugun- 
gen empirisch messen lässt, dass die vorgeschlagene Operationalisierung und 
Datenanalyse geeignet ist, das theoretisch hergeleitete BDGS abzubilden. 

Bezüglich der zweiten aufgeworfenen Forschungsfrage, die nach der Ausprä- 
gung der Überzeugungen und ihrer Beziehungen untereinander fragt, zeigt sich, 
dass die Mittelwerte der einzelnen Dimensionen in Erhebung 1.3 hierbei etwas 
größer ausfallen als in den beiden Erhebungen zuvor. Dieses Ergebnis indiziert, 
dass trotz der generellen Stabilität des BDGS je nach Stichprobe unterschiedlich 
hohe Ausprägungen des BDGS beobachtet werden können. Es zeigt sich auch 
hier erneut, dass der erwartete Wissensgewinn positiv ausgeprägt ist, während die 
Ausprägungen der anderen Dimensionen um den Skalenmittelpunkt liegen. 

Im Aggregat erfahren die Aussagen, dass digitale Daten zu einem Wissens- 
gewinn führen, durchweg eine hohe Zustimmung. Dies ist als erstes Indiz dafür 
zu werten, dass der Mythos eines weitreichenden Erkenntnisgewinns durch die 
Sammlung und Auswertung großer digitaler Datenbestände einen Niederschlag in 
der Wahrnehmung der Befragten gefunden hat. Diese positive Konnotation von 
Wissen vor dem Hintergrund der Wissensgesellschaft ist dabei eng verbunden mit 
Erwartungen an einen individuellen und gesellschaftlichen Nutzen. 

Insgesamt zeigen sich hohe Inter-Korrelationen zwischen den einzelnen 
Dimensionen des BDGS, was indiziert, dass ihre jeweilige Ausprägung unter- 
einander in einer engen Beziehung steht. Dabei gibt Erhebung 1.3 entscheidende 
Hinweise zur Diskriminanzvalidität der latenten Faktoren des Modells. Die Prä- 
sentation der Items führt zu einem kognitiven Befragungseffekt. Mit Blick auf die 
Ergebnisse sind Befragte eher dazu geneigt, zwischen den einzelnen Dimensionen 
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des BDGS zu unterscheiden, wenn diese auf unterschiedlichen Fragebogenseiten 
zu finden sind. 

Es wird allerdings aus diversen Gründen nur in den wenigsten Befragungsstu- 
dien möglich sein, eine Skala, wie sie mit der Messung des BDGS vorliegt, so in 
den Fragebogenverlauf einzubetten, dass ihr Einsatz gänzlich unproblematisch ist. 
Dies wird vermutlich nur dort der Fall sein, wo eine ganz spezielle Dimension 
von Forschungsinteresse ist. Sind alle Dimensionen gleich bedeutend, so stellt 
sich das Problem, dass (a) die BDGS-Skala aus forschungsökonomischen Grün- 
den nicht auf mehrere Seiten aufgeteilt werden kann, (b) berücksichtigt werden 
muss, dass auch eine Aufteilung Reihenfolgeeffekte nach sich ziehen kann und 
(c) eine Aufteilung über mehrere Seiten immer dann problematisch ist, wenn die 
gesamte Befragung auf ein Phänomen oder Artefakt im Digitalisierungskontext 
abstellt und der restliche Fragebogen weitere Skalen mit Bezug zur Digitali- 
sierung beinhaltet. Diese Problematik sollte bei jedem Einsatz der BDGS-Skala 
erneut sorgfältig geprüft werden. 

Mit dem Wissen um die Reihenfolgeeffekte des Fragebogenaufbaus bedeu- 
tet das Folgendes: In Studien, in denen die Wechselwirkungen zwischen den 
einzelnen Dimensionen im Vordergrund stehen und einer Aufteilung aus for- 
schungsökonomischen Gründen nichts entgegensteht, können und sollten die 
Dimensionen auf unterschiedlichen Fragebogenseiten präsentiert werden, wobei 
sich auch hier die Frage stellt, in welcher Reihenfolge die Dimensionen abgefragt 
werden. So ließen sich womöglich konvergente und diskriminante Validität besser 
sicherstellen, als wenn alle Items rotiert auf einer Seite zu finden sind.!7 Letzteres 
ist jedoch aus Gründen der Fragebogenlänge eine zu präferierende Lösung, wenn 
wie in den nachfolgenden Erhebungen die BDGS-Skala in Fragebögen mitläuft, 
die noch andere Forschungsziele verfolgen. Deshalb und aus forschungsökonomi- 
schen sowie Konsistenzgründen wurde daher in den nachfolgenden Erhebungen 
auf eine Aufteilung der BDGS-Skala verzichtet und diese jeweils auf einer Seite 
abgebildet, wobei die Reihenfolge der Items zufällig rotiert wurde. 


17 Da dies tatsächlich nur für die beiden Dimensionen der Richtigkeit und der Nutzendi- 
mensionen geprüft wurde und nicht zwischen den jeweils zu den beiden Oberdimensionen 
gehörenden Subdimensionen, liegen noch keine umfassenden empirischen Belege vor und 
es bleibt zunächst bei einer Vermutung, dass dies für alle Dimensionen gelten könnte. Dies 
beinhaltet zudem noch keine Aussagen oder Erkenntnisse über mögliche Reihenfolgeeffekte 
bedingt durch die Abfolge der einzelnen Dimensionen. 
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9.3 Reflexion über die Skalenerstellung im Anschluss 
an Skalenkonstruktion und Validierung 


Um eine Vergleichbarkeit der Ergebnisse aus den einzelnen Erhebungen der 
Skalenerstellung herzustellen, wurde die Skala wie dokumentiert in allen Erhe- 
bungen in nahezu gleicher Weise eingesetzt und wurden dabei die Einleitung 
der Fragebatterie, die Formulierungen der einzelnen Items sowie die Skalierung 
und die Benennung aller Skalenpunkte durchweg konstant gehalten. Es liegt in 
der Natur der Skalenerstellung, dass durch den Einsatz der Skala Erkenntnisse 
gewonnen wurden, die nach wiederholtem Einsatz für eine Anpassung sprächen. 
Aufgrund des Anspruchs an Vergleichbarkeit und weiterer Gründe, wie etwa der 
vermeintlichen Geringfügigkeit der Bedeutung vieler einzelner Probleme, wur- 
den Änderungen jedoch nicht umgesetzt. Allerdings sollen Erkenntnisse, die u. a. 
aus der Rückmeldung der Befragten und Reviewer*innen gewonnen wurden, 
sowie die gesammelten Erfahrungen des federführenden Autors (die über die 
Diskussion der Diskriminanzvalidität im vorherigen Abschnitt hinausgehen) in 
diesem Abschnitt dokumentiert und reflektiert werden. Zum einen zur Dokumen- 
tation, um ein besseres Verständnis für die Verwendung der Skala herzustellen 
und etwaige Rückmeldungen der Befragten in zukünftigen Studien zu antizi- 
pieren. Zum anderen als Empfehlung, um bei zukünftigen Skalenentwicklungen 
frühzeitig bedacht zu werden und mögliche Befragungsprobleme zu vermeiden. 

Man könnte dann aufgrund dieser Erfahrungen und weitergehendem Inter- 
esse mit Blick auf die Methodenforschung der Befragung bei der zukünftigen 
Verwendung mit Hilfe eines Split-Sample-Designs etwaige Änderungen testen 
und mögliche Auswirkungen auf die Beantwortung der Skala prüfen. Mögliche 
Probleme und entsprechende Änderungen lassen sich dabei ganz grob unterschei- 
den nach (a) der Problematik der Formulierungen und (b) der Präsentation der 
Fragebogenitems. 


9.3.1 Problematik der Formulierungen der Fragebogenitems 


Das Gros der Rückmeldungen betraf problematische Formulierungen innerhalb 
des Einleitungstextes sowie der Itemformulierungen selbst, die einen Einfluss 
auf das Verständnis der Frageitems haben könnten und dadurch auch auf die 
Ergebnisse der Testbatterie. Probleme konnten hier mit Blick auf (a) Synonyme 
und subjektiv identische Begriffe sowie (b) Einflüsse aktueller Ereignisse und 
Modewörter unterschieden werden. 
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Synonyme und subjektiv identische Begriffe 

Manche Formulierungen waren laut einigen wenigen Rückmeldungen für manche 
Befragte subjektiv nicht unterscheidbar, was durch die hierdurch ausgelöste Irrita- 
tion zu einer Verzögerung in der Bearbeitung führen könnte. So erfolgte hin und 
wieder der Hinweis (v. а. in der nachfolgenden Erhebung 2.4 КІ & Hochschule), 
dass die Worte exakt und genau, die in den Frageitems mit den IDs GEI und GE2 
der Subdimension Genauigkeit vorkamen, identisch sind oder synonym verwen- 
det werden. Dies schließt sich an übliche Rückmeldungen aus Befragungen an, 
dass bei den Befragten das Gefühl bestand, eigentlich immer das Gleiche gefragt 
zu werden. Im Sinne der Drei-Item-Messung, die für Indikatoren von latenten 
Konstrukten empfohlen wird (J. C. Anderson & Gerbing, 1984, 1988; Weiber & 
Mühlhaus, 2014) und in den vorliegenden Erhebungen eingesetzt wurde, besteht 
durchgängig die Schwierigkeit, Items so zu formulieren, dass sie zwar sprachlich 
zu unterscheiden sind, gleichzeitig jedoch das Wesen und den Kern des zugrunde 
liegenden Konstrukts so genau und repräsentativ wie möglich reflektieren soll- 
ten. Die Items sollen gut, also hoch, auf das jeweilige latente Konstrukt laden 
und gleichzeitig nicht zu ähnlich verfasst sein, was mitunter zur Monotonie des 
Fragebogens führt (Petersen, 2014; Weiber & Mühlhaus, 2014). Dies muss bei 
der Formulierung fortlaufend abgewogen werden und führte im vorliegenden Fall 
letztendlich dennoch zur Wahl synonymer Begrifflichkeiten. Das geringe Ausmaß 
entsprechender Rückmeldungen der Befragten in den einzelnen Erhebungen ver- 
anlassen hier dann auch nicht zur Beunruhigung bezüglich der Reliabilität und 
Validität der entsprechenden Items. Jedoch hat die sprachliche Nähe synonymer 
Formulierung einen Einfluss auf die Modellgüte der Messmodelle in der kon- 
firmatorischen Faktorenanalyse, was mit Verweis auf die Modifikationsindizes 
nachfolgend an den entsprechenden Stellen vermerkt wird. Je nach Rotation der 
Items innerhalb der Skala kommt es zudem zu Unterschieden in der Stärke geteil- 
ter Varianz einzelner Frageitems einer Dimension. Mit Blick auf die Fallzahlen 
der Stichprobengrößen sollten sich diese zufällig zustande kommenden geteilten 
Varianzen aufgrund der Rotation zwar nur selten ergeben, auszuschließen sind sie 
jedoch nicht. 


Mögliche Einflüsse aktueller Ereignisse und Diskurse 

In der nachfolgend besprochenen Erhebung 2.1 merkten zwei Befragte nach der 
Teilnahme an, dass die Formulierung „Digitale Daten führen zu neuen Fakten“ 
(Item-ID W2) vor dem Hintergrund der Debatte um sogenannte Fake News und 
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alternative Fakten als problematisch wahrgenommen wurde IP Der Begriff ‚Alter- 
native Fakten‘ fand im Januar 2017 öffentliche Aufmerksamkeit, als Kellyanne 
Conway, Beraterin des 45. US-Präsidenten Donald Trump, mit diesem Ausspruch 
widersprüchliche Angaben eines Pressesprechers des Präsidenten rechtfertigte. 
Das Wort erfuhr im Jahresverlauf wiederholt große Beachtung und wurde in 
Deutschland und Österreich zum Unwort des Jahres 2017 gewählt (Der Stan- 
dard, 2018; Frankfurter Allgemeine Zeitung, 2018). Es ist nicht auszuschließen, 
dass einzelne Befragte sich während der Beantwortung des Items an jene Debatte 
erinnern. Allerdings ergibt die Datenauswertung der Erhebung 1.1 bis 1.3 keine 
Hinweise darauf, dass dies zu einer schlechteren Ladung des entsprechenden 
Items auf das latente Konstrukt geführt hat. Wie sich jedoch nachfolgend zeigen 
wird, weist das entsprechende Item ab Erhebung 2.1 tatsächlich eine entsprechend 
schlechtere Ladung auf, worauf an der entsprechenden Stelle hingewiesen wird. 


9.3.2 Problematik der Präsentation der Fragebogenitems 


Die Aufteilung der BDGS-Skala auf zwei Fragebogenseiten in Erhebung 1.3 
verfolgte das Ziel, Erkenntnisse über den Einfluss von Reihenfolgeeffekten auf 
die diskriminante Validität zu gewinnen, und zeigt, dass die Präsentation der 
Fragebogenitems einen Einfluss auf die Beantwortung der Skala hat. 

Zusammen mit der zuvor diskutierten begrifflichen Ähnlichkeit der Fragebo- 
genitems könnte überlegt werden, die Frageitems der Skala über verschiedene 
Fragebogenseiten aufzuteilen oder die Anzahl der Fragebogenitems zu reduzie- 
ren. Beide Entscheidungen können jedoch nur in Abhängigkeit von der jeweiligen 
Forschungsfrage und dem Ziel des Einsatzes der BDGS-Skala oder einzelner 
benötigter Dimensionen der BDGS-Skala getroffen werden. Muss der Frage- 
bogen möglichst kurz ausfallen, kann zudem eine Reduktion der BDGS-Skala 
auf die zentralen Frageitems einer Dimension (bspw. die Referenzindikatoren) 
vorgenommen werden, die auf einer Seite präsentiert werden. 


18 Weitere Informationen zur wissenschaftlichen Untersuchung von Fake News finden sich 
bei D. М. J. Lazer et al. (2018). Zur Bedeutung von Fake News in der politischen Kommu- 
nikation siehe Schulz et al. (2017). 
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Studie 2 - Die Auswirkungen der 1 0 
Überzeugungen des Glaubens ап Big 

Data - Erkenntnisse aus vier 

empirischen Erhebungen 


Im Nachgang zu Skalenkonstruktion und -validierung wurde die BDGS-Skala 
zwischen Januar und Oktober 2019 in vier weiteren empirischen Forschungszu- 
sammenhängen eingesetzt und wurden Daten für die Ausprägung des BDGS in 
den vier jeweiligen Stichproben erhoben. Diese werden nachfolgend entsprechend 
Erhebung 2.1 EU und KI, Erhebung 2.2 KI-Bedrohung, Erhebung 2.3 Krankenver- 
sicherung und Erhebung 2.4 KI und Hochschule benannt. In den nachfolgenden 
Abschnitten werden die vier empirischen Forschungszusammenhänge mit dem 
jeweiligen Erkenntnisinteresse besprochen und wird das empirische Vorgehen 
so knapp und dennoch so nachvollziehbar wie möglich dokumentiert. Ziel der 
Erhebungen, die zur zweiten Studie dieser Arbeit gehören, war es, die dritte auf- 
geworfene Forschungsfrage zu beantworten, die danach fragt, welche Auswirkung 
die Überzeugungen des Glaubens an große digitale Datenbestände auf Einstellun- 
gen zum Einsatz von KI-Anwendungen haben (siehe Kapitel 7). Hierzu wurde 
die BDGS-Skala im Rahmen unterschiedlicher Anwendungsfälle als unabhän- 
gige Variable modelliert und ihre vermutete Erklärungskraft in unterschiedlichen 
Forschungszusammenhängen gesellschaftlicher Datensammlung und -verwertung 
geprüft. Den untersuchten Forschungskontexten ist dabei gemein, dass sie sich auf 
datenbasierte KI-Anwendungen beziehen, denen derzeit eine hohe Aufmerksam- 
keit zukommt und für die sich immer besonders hohe Ansprüche an die Qualität 
und den Umfang der Preisgabe digitaler Daten stellen. Die Erhebungen folgen 
dabei einer aufeinander aufbauenden Logik: Am Beispiel von Modellanwen- 
dungen der KI, die derzeit in unterschiedlichen Lebensbereichen implementiert 
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werden oder deren Implementierung in naher Zukunft angedacht ist, wird der 
erwartete Einfluss des BDGS auf kognitive, affektive sowie konative Kompo- 
nenten der Einstellungen der Bürger*innen zu diesen Anwendungen untersucht 
(Maio et al., 2018). 


10.1 Erkenntnisinteresse BDGS 


Zunächst einmal wird basierend auf den Vorerfahrungen mit den drei Erhebungen 
aus Studie 1 davon ausgegangen, dass sich bei einer weitreichenden Verbrei- 
tung des BDGS, also der Grundannahme der vorliegenden Arbeit, auch bei den 
Befragten der Erhebungen in Studie 2 die festgestellte Struktur der Ausprägung 
des BDGS und seiner Dimensionen feststellen lassen müsste. Das BDGS sollte 
sich als insgesamt stabiles Wahrnehmungsmuster bei den Bürger*innen vorfinden 
lassen, wobei jedoch je nach Befragtengruppe dennoch eine unterschiedlich hohe 
Ausprägung der einzelnen Glaubensüberzeugungen beobachtet werden kann. Die 
Dimensionen Genauigkeit, individueller Nutzen sowie gesellschaftlicher Nutzen 
sollten dabei im Aggregat eine variable, weitgehend ausgeglichene Zustimmung 
erfahren. Mit Blick auf den Wissensgewinn wird davon ausgegangen, dass die 
besondere Stellung des Wissens vor dem Hintergrund von Erkenntnisgewinnen 
auf Grundlage der digitalisierungsgetriebenen Quantifizierung des Sozialen und 
gesellschaftlicher Diskurse rund um die Wissensgesellschaft sowie den Mythos 
Big Data zu einer insgesamt positiven Ausprägung führt. Zudem wird bezüg- 
lich der Struktur des Wahrnehmungsmusters davon ausgegangen, dass bei einer 
hohen Zustimmung zu den Glaubenssätzen einer Dimension des BDGS auch 
den Glaubenssätzen der anderen Dimensionen zugestimmt wird. Der Glaube an 
den Erkenntnisgewinn durch digitale Daten geht einher mit Überzeugungen an 
einen hieraus resultierenden Nutzen. Hierzu werden daher vor der Datenerhebung 
folgende Hypothesen aufgestellt: 


Hla: Die Dimension ‚Wissensgewinn‘ des BDGS ist positiv ausgeprägt. ! 


! In der Präregistrierung wurde von der Dimension ‚Wissen‘ gesprochen, was hier ange- 
passt wurde. Zudem wurde in der Präregistrierung folgender Satz ergänzt: „D. h., wenn 
der Skalenmittelpunkt mit О codiert wird, ist die Ausprägung der Dimension ‚Wissen‘ im 
Mittel größer als null.“ Für die vorliegende Auswertung in Abschnitt 10.7 werden jedoch 
die Mittelwerte der einzelnen Dimensionen auf null restringiert, so dass die geschätzten 
Regressionskonstanten (Intercepts) zur Prüfung der Hypothese herangezogen werden. 
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H1b: Die vier erhobenen Dimensionen des ВРС kovariieren positiv miteinan- 
der.” 


Weiterhin wird angenommen, dass die Kognitionen des Wahrnehmungsmus- 
ters des BDGS einen Einfluss auf die kognitiven, affektiven sowie konativen 
Komponenten der Einstellungsbildung haben. In Situationen, in denen Personen 
auf datenbasierte KI-Anwendungen treffen, werden bei ihnen die persönlichen 
Überzeugungen bezüglich der Eigenschaften und Konsequenzen digitaler Daten 
aktiviert. Die generelle Annahme ist dann, dass Personen mit hoch ausgeprägtem 
BDGS durch dessen Aktivierung dann positivere Vorstellungen und emotionale 
Bezüge sowie eine erhöhte Verhaltensneigung zur Nutzung dieser digitalen Inno- 
vationen in unterschiedlichen Lebensbereichen zeigen. Daher wird an dieser 
Stelle ganz allgemein folgende Hypothese aufgestellt, die im Rahmen der Studie 
2 dieser Arbeit geprüft wird: 


H2: Je ausgeprägter das BDGS, desto positiver die kognitiven, affektiven 
und konativen Komponenten der Einstellung gegenüber datenbasierten KI- 
Anwendungen. 


Dieser Einfluss des BDGS wurde im Rahmen von Studien in unterschiedlichen 
Forschungszusammenhängen geprüft und die aufgestellten Annahmen werden 
abgeleitet von H2 nachfolgend an den entsprechenden Anwendungsfall der 
Erhebungen angepasst. 


10.2 Anmerkungen zur Durchführung der empirischen 
Arbeit und der Reichweite der Befunde 


Bevor jedoch über den Einsatz in der empirischen Forschung und die hierdurch 
gewonnenen Erkenntnisse über Struktur und Einfluss des BDGS berichtet wird, 
sind zur Einordnung dieser Erkenntnisse zunächst ein paar allgemeine Anmer- 
kungen zum Rahmen der empirischen Forschungsarbeit und der Reichweite der 
Befunde notwendig. An einigen Stellen bei der Datenerhebung und Datenaus- 
wertung weichen die tatsächlich zu realisierenden Möglichkeiten vom Ideal des 
Forschungsprozesses ab, was vorweg transparent zu machen ist. 


? In der Präregistrierung fand sich in der Hypothese noch die folgende Ergänzung als Hilfs- 
beispiel für die Interpretation: „Je höher bspw. die Zustimmung zum beinhalteten Wissen in 
den Daten, desto positiver der erwartete Nutzen für das Selbst.“ 


184 10 Studie 2 - Die Auswirkungen der ... 


Ausprägung und Einflüsse des BDGS als sekundäres Erkenntnisinteresse 

Dabei ist zur Einordnung der Studiendurchführung und ihrer Befunde an die- 
ser Stelle darauf hinzuweisen, dass der Einsatz und die Prüfung des besagten 
Einflusses der Dimensionen des BDGS bei keiner der Erhebungen das primäre 
Erkenntnisinteresse darstellten. Das hat zum einen etwaige Konsequenzen für die 
Datenerhebung, zum anderen jedoch insbesondere auch für die Datenauswertung 
und muss als Limitation der Forschung reflektiert werden. Für die Datenerhebung 
müssen Ausstrahlungs- und Reihenfolgeeffekte beachtet werden, die nachfolgend 
an den entsprechenden Stellen diskutiert werden. Zwar wurde die BDGS-Skala 
immer im identischen Format verwendet, allerdings an unterschiedlichen Stellen 
in den jeweiligen Fragebögen. Es stand daher die Beantwortung der eigentlichen 
Forschungsfragen des jeweiligen Untersuchungszusammenhangs im Vordergrund. 
Diese bedingte somit maßgeblich den Ablauf der Befragung sowie den Auf- 
bau des Instruments. Es kann folglich vorkommen, dass die BDGS-Skala erst 
auf einer der hinteren Fragebogenseiten zu finden war, teilweise gar nach Varia- 
blen, die als abhängige endogene Variablen modelliert wurden. Da im Rahmen 
von Querschnittsstudien, insbesondere ohne experimentelles Design kaum valide 
Kausalaussagen zulässig sind (Pearl et al., 2016; Steinhage & Blossfeld, 1999), 
wird auf die entsprechende Problematik an den entscheidenden Stellen der ein- 
zelnen Forschungszusammenhänge hingewiesen, muss jedoch als eine generelle 
Limitation der vorliegenden Forschungsbemühungen reflektiert werden. 


Forschungsökonomische Restriktionen bezüglich Stichprobengröße, statistischer 
Power und zu erwartender Effektstärken 

Bei der Datenauswertung muss ebenfalls berücksichtigt werden, dass die Rekru- 
tierung der jeweiligen Stichprobe und speziell deren finale Größe durch das 
dominierende Erkenntnisinteresse beeinflusst war. Das bedeutet auch, dass sich 
vorherige Berechnungen der notwendigen Stichprobengröße für die Trennschärfe 
der statistischen Auswertung („statistische Power“; Fahrmeir et al., 2016, S. 393) 
zwar durchführen ließen, allerdings keinen Einfluss auf die Realisierung einer 
geforderten Mindestanzahl an Befragten für die Prüfung der erwarteten Zusam- 
menhänge hatten. Zudem ist die Powerberechnung für komplexere Modelle meist 
schwierig und ist mit gängigen Werkzeugen zur Powerberechnung wie etwa 
G*Power nur eingeschränkt oder gar nicht möglich.” Die vorherige Durchführung 


3 Kurz vor Einreichung dieser Arbeit wurde im April 2020 von Y. A. Wang und Rhemtulla 
(2020) ein neues Tool zur Parameterschätzung im Rahmen der Strukturgleichungsmodellie- 
rung vorgestellt. 
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von Simulationen erzeugt zusätzlichen Aufwand und war im Forschungszusam- 
menhang ebenso nur eingeschränkt möglich. Zudem müssen hierfür jedoch auch 
erst einmal Vorannahmen über die erwarteten Zusammenhänge bestehen oder for- 
muliert werden. So gehen einige Forschende dazu über, vorher festgelegte kleinste 
bedeutungsvolle Effektstärken (,Smallest Effect Sizes of Interest‘) zu formulieren 
(Lakens, 2014, 2017). Mit Blick auf die Tragweite der Einführung und Diffu- 
sion von KI-Anwendungen in kritischen Lebensbereichen könnten auch kleine 
Effekte von Glaubensauffassungen wie solchen des BDGS mitunter weitreichende 
Konsequenzen haben. Allerdings existierten zu geringe Vorerfahrungen mit dem 
Einsatz der BDGS-Skala, als dass vorab konkrete Erwartungen für deren Ein- 
flussstärke gemacht werden können. Es gab mithin nur unzureichende Annahmen, 
die einer ersten Einschätzung der zu erwartenden Stärke von Zusammenhängen 
zuträglich wären. Daher orientieren sich Bericht und Interpretation des Vorgehens 
und der Ergebnisse an den geltenden Konventionen der empirischen Sozialfor- 
schung, selbst wenn diese, wie an den entsprechenden Stellen deutlich wird, 
voraussetzungsreich sind, notwendige und hinreichende Bedingungen einem fort- 
laufenden Wandel unterliegen und zudem aus forschungsökonomischen Gründen 
(sprich: zeitlichen und materiellen Ressourcen) nicht alle Wünsche im Rahmen 
der Datenerhebung auch immer erfüllt werden können. 


Konsequenzen der Datenstruktur im Rahmen der Auswertungsstrategie 

Zuletzt bestehen mit Blick auf die Struktur des BDGS und der hierzu gesam- 
melten Daten Herausforderungen für die Auswertung. Hier ist u. a. auf die hohe 
Inter-Korrelation der BDGS-Dimensionen einzugehen, welche in den vorausset- 
zungsreicheren Strukturregressionsmodellen gepaart mit kleinen Stichprobengrö- 
Ben, einer geringen Anzahl von Indikatoren, der hierdurch bedingten geringen 
dimensionalen Verschiedenheit sowie hoher Multikollinearität zu Problemen bei 
der Modellschätzung und Ergebnisinterpretation führen kann (Grewal et al., 2004; 
Jagpal, 1982; Marsh et al., 2004). Wie zuvor in Abschnitt 9.2.2 dokumentiert, ist 
den Modellen mit korrelierten Faktoren (CFM) der Vorzug vor Modellen mit 
einem Faktor zweiter Ordnung (SOFM) zu geben. Dennoch bestehen bedingt 
durch die hohen Inter-Korrelationen häufig Zweifel bezüglich der tatsächlichen 
Unterschiedlichkeit der Effekte, wenn sich bei einem von zwei hochkorrelierten 
Faktoren ein signifikanter und ein nicht-signifikanter Einfluss auf eine abhängige 
Variable zeigen. Diese Unterschiedlichkeit kann durch entsprechende Identitäts- 
restriktionen (in vorliegendem Fall durch Gleichheitsrestriktionen) im Modell 
entsprechend geprüft werden und wird folglich an den entsprechenden Stellen 
thematisiert. Es ist jedoch bereits an dieser Stelle notwendig, darauf hinzuweisen, 
dass bei zukünftigen Studien vorher genau darauf abgestellt werden sollte, welche 
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Dimensionen des BDGS von Interesse sind, insbesondere mit Blick auf die erwar- 
tete Stärke der Zusammenhänge und damit zusammenhängenden Anforderungen 
an die statistische Power und die zu realisierende Stichprobengröße. 


10.3 Erhebungskontexte 


10.3.1 Erhebung 2.1 - Big Data, КЇ und europäische 
Politikentscheidungen 


Erhebung 2.1 EU und KI und auch Erhebung 2.3 Krankenversicherung (siehe 
Abschnitt 10.3.3) wurden im Rahmen zweier Studien eines Lehrforschungs- 
projekts im Bachelor Sozialwissenschaften im Wintersemester 2018/19 an der 
Heinrich-Heine-Universität (HHU) Düsseldorf durchgeführt. In beiden Erhebun- 
gen wurde auch die BDGS-Skala erhoben, deren Ergebnisse nachfolgend berichtet 
werden. 

Das Erkenntnisinteresse der Studie, in deren Rahmen Erhebung 2.1 EU und 
KI durchgeführt wurde, betraf den Anwendungsbereich von KI im Rahmen 
der Vorbereitung und Festlegung von politischen Entscheidungen auf Ebene der 
Europäischen Union (EU). Genauer ging es um die wahrgenommene politische 
Legitimität dieser als Algorithmic Decision-Making (ADM) bezeichneten Ent- 
scheidungsfindung bei den Bürger*innen, wobei mit Legitimität hier zunächst 
eine kognitive Komponente der Einstellung in den Fokus rückt. Ausführliche 
Informationen dieser Studie finden sich bei Starke und Lünich (2020). 


Die Legitimität politischer Entscheidungen der EU 

Um effektive Politikentscheidungen zu treffen und aktuellen Herausforderungen 
zu begegnen, ist die EU auf politische Legitimität angewiesen. Hierfür ist die 
EU insbesondere auf das Wohlwollen und die Unterstützung ihrer politischen 
Subjekte, also der Bürger*innen angewiesen: “Governance can be considered 
legitimate in so far as its subjects regard it as proper and deserving of support” 
(Gurr, 1971, S. 185). Dabei wurde von Scharpf (1999) zunächst zwischen der 
Legitimität des Inputs und des Outputs unterschieden. Gemäß V. A. Schmidt 
(2013) wird Input-Legitimität wie folgt beschrieben: “Responsiveness to citi- 
zen concerns as a result of participation by the people” (V. A. Schmidt, 2013, 
S. 2, Hervorh. im Orig.). Sie ist mithin abhängig von freien und fairen Wahlen, 
hoher Wahlbeteiligung und einem lebhaften politischen Diskurs der Öffentlichkeit 
(Scharpf, 1999). Output-Legitimität meint hingegen Folgendes: “The effectiven- 
ess of the EU’s policy outcomes for the people” (V. A. Schmidt, 2013, S. 2). 
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Dies betrifft die tatsächliche Fähigkeit der EU, durch ihr politisches Wirken 
Herausforderungen wie die Sicherung von Frieden, Umweltschutz und wirtschaft- 
lichem Wohlstand zu erreichen (Føllesdal, 2006). Schließlich wird auch noch die 
Throughput-Legitimität ergänzt, die auf die Rechenschaftspflicht, Wirksamkeit 
und Transparenz der politischen Entscheidungstragenden im Entscheidungspro- 
zess abstellt (V. A. Schmidt, 2013; V. A. Schmidt & Wood, 2019; Steffek, 2019). 
Diese Legitimitätsdimension stellt mithin folgende Anforderung an den Entschei- 
dungsprozess: “Inclusiveness and openness to consultation with the people” (V. 
A. Schmidt, 2013, S. 2, Hervorh. im Orig.). 

Mit Blick auf den europäischen Integrationsprozess wurde vielfach über die 
mangelnde politische Legitimität der EU und ihrer politischen Entscheidungen 
diskutiert, wobei demokratische Defizite sowie das Fehlen einer europäischen 
Identität und einer gesamt-europäischen Öffentlichkeit als Gründe für eine Legi- 
timitätskrise der EU angeführt wurden (Føllesdal & Hix, 2006; Habermas, 
2009). 


Datengetriebene evidenzbasierte Politikgestaltung als Antwort auf mangelnde 
Legitimität der EU 

Vor dem Hintergrund dieser Legitimitätskrise der EU gibt es Bestrebungen inner- 
halb der EU-Institutionen, dem wahrgenommenen Legitimitätsdefizit durch das 
sogenannte ‚Evidence-based Policy-Making‘ zu begegnen, was sich mit evidenz- 
basierter Politikgestaltung übersetzen lässt. “Against the backdrop of multiple 
crises, policymakers seem ever more inclined to legitimize specific ways of 
action by referring to ‘hard’ scientific evidence suggesting that a particular initia- 
tive will eventually yield the desired outcomes” (Rieder & Simon, 2016, $. 1). 
Politische Entscheidungen und Programme werden hierbei also auf Grundlage 
wissenschaftlicher Erkenntnis begriindet. Dies geht einher mit der in dieser Arbeit 
diskutierten Durchdringung der Gesellschaft mit digitaler Computertechnologie, 
bei der Unmengen von digitalen Daten erzeugt und gespeichert werden. Zur 
Erinnerung: Diesen als Big Data bezeichneten digitalen Daten werden große 
Potentiale für einen Erkenntnisgewinn zugeschrieben, der eben auch jenem in 
dieser Arbeit thematisierten Glauben an Big Data zugrunde liegt und der auch 
mit Blick auf die evidenzbasierte Politikgestaltung zum Tragen kommt. Es liegt 
daher nahe, diese Big Data auch aus Sicht der EU als ein wichtiges Gut im 
Rahmen evidenzbasierter Politikgestaltung zu begreifen, die nunmehr datenba- 
siert getroffen werden können (Esty & Rushing, 2007; Giest, 2017; Poel et al., 
2018). So hat bspw. die Europäische Kommission die Initiative Data4Policy mit 
folgender Überzeugung ins Leben gerufen: “Data technologies are amongst the 
valuable tools that policymakers have at hand for informing the policy process, 
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from identifying issues, to designing their intervention and monitoring results” 
(Europäische Kommission, 2017a, $ 1). 

Zusammen mit dem gerade aufkommenden öffentlichen Interesse und den 
großen Erwartungen an Anwendungen von КЇ geraten auch diese aktuellen Vor- 
stöße zu datengetriebener evidenzbasierter Politikgestaltung und der diesbezügli- 
chen Verwertung der großen digitalen Datenbestände in den Fokus der politischen 
Entscheidungstragenden. Rieder und Simon (2016) sehen die skizzierten Entwick- 
lungen und das Vertrauen auf Grundlage datenbasierter Verfahren — der bei ihnen 
sogenannte ‚Datatrust‘ — bei der Politikgestaltung insbesondere auch im Lichte 
der Legitimitätskrise der EU. So kommen van Veenstra und Kotterink (2017) zu 
dem Ergebnis: “Data-driven policy making is not only expected to result in better 
policies, but also aims to create legitimacy” (S. 101). 


Erwartungen und Herausforderungen mit Bezug auf Anwendungen von Automated 
Decision-Making im Rahmen der datengetriebenen evidenzbasierten Politikgestal- 
tung 
Dabei werden automatisierte Anwendungen der Entscheidungsfindung auf Grund- 
lage fortlaufender computerisierter Datenauswertung u. a. dafür eingesetzt, 
öffentliche Dienstleistungen zu erbringen, den Verkehrsfluss zu optimieren oder 
Sozialbetrug aufzudecken (AlgorithmWatch, 2019; Bansak et al., 2018; Poel 
et al., 2018). Mithin können Anwendungen des ADM potenziell zu einer Erhö- 
hung der Legitimität in allen drei Dimensionen beitragen: Auf Seiten des 
Inputs, indem sie neue Formen demokratischer Beteiligung ermöglichen und neue 
Datenquellen und Eingabeformate erschließen, die zuvor keinen Eingang in den 
Entscheidungsprozess fanden. Bezüglich des Throughputs, indem sie den politi- 
schen Prozess standardisieren und so weniger anfällig für bestimmte menschliche 
Fehler machen, wobei auch auf eine verbesserte Transparenz automatisierter Pro- 
zesse hingewirkt wird (Fine Licht & Fine Licht, 2020). Letztlich mit Blick auf 
den Output, indem sie die Qualität politischer Programme und Entscheidungen 
sowie deren Ergebnisse verbessern sollen (B. W. Wirtz et al., 2018). 
Gleichzeitig finden sich in der Literatur jedoch auch immer wieder Bei- 
spiele, die auf die Nachteile von automatisierten Systemen hindeuten, bei denen 
KI-Anwendungen zum Einsatz kommen (Richardson, Schultz & Southerland, 
2019). Situationen, in denen Bürger*innen durch ADM fälschlicherweise des 
Betrugs beschuldigt werden, sie irrtümlich von Nahrungsmittelhilfeprogrammen 
ausgeschlossen oder ihre Sozialleistungen gekürzt werden, führen nicht nur zu 
folgenschweren Nachteilen bei den Betroffenen und verfehlen somit das Ziel, 
qualitativ hochwertige Ergebnisse zu produzieren. Sie führen zudem auch nicht 
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zu effizienterer Entscheidungsfindung, wenn diese Fehlentscheidungen zu Klage- 
wellen durch die Betroffenen führen. Letztlich sind hierdurch jedoch auch und 
insbesondere negative Effekte auf die wahrgenommene Legitimität der ADM- 
Anwendungen zu erwarten. Es bestehen allgemein im Hinblick auf die drei 
Dimensionen der Legitimität bei den Bürger*innen wichtige Herausforderungen, 
die jene ADM-Anwendungen mit sich bringen: Auf Seiten des Inputs haben die 
Betroffenen möglicherweise mangelnden Einblick und Einfluss auf die Krite- 
rien oder Datenbanken, die Algorithmen zur Entscheidungsfindung nutzen. In 
Hinsicht auf den Throughput sind sie möglicherweise nicht in der Lage, die 
komplexe und oft undurchschaubare Logik zu verstehen, die den algorithmischen 
Vorhersagen, Empfehlungen oder Entscheidungen zugrunde liegt. So haben die 
Betroffenen in Bezug auf den Output möglicherweise grundlegende Zweifel, ob 
ADM-Anwendungen tatsächlich zu einer effizienteren Politik beitragen. 

Es ist folglich fraglich, ob und inwieweit ADM-Anwendungen im Rahmen der 
datengetriebenen evidenzbasierten Politikgestaltung als positiv oder negativ wahr- 
genommen werden und ob sie die erhoffte Steigerung politischer Legitimität der 
EU herbeiführen können. Wie üblich hängen hierbei Erfolg und Misserfolg des 
weitläufigen Einsatzes von ADM-Anwendungen auch von der öffentlichen Bewer- 
tung und Akzeptanz ab (Bauer, 1995b). Eine aktuelle Befragung von Rubio und 
Lastra (2019) liefert diesbezüglich folgendes Indiz: Rund ein Viertel aller Euro- 
päer sei derzeit eher oder voll und ganz dafür, KI wichtige Entscheidungen über 
die Geschicke des eigenen Landes anzuvertrauen. Das primäre Erkenntnisinter- 
esse der vorliegenden Studie war es nun, zu untersuchen, inwieweit ADM auf 
Ebene der EU zu einer erhöhten Wahrnehmung politischer /nput-, Throughput- 
und Output-Legitimität führt. 


Der Einfluss des BDGS auf die Wahrnehmung der Legitimität von ADM für 
Politikentscheidungen auf Ebene der EU 

Im Rahmen dieser Untersuchung, die auf unterschiedliche Verfahren bei der 
Erstellung und Verabschiedung des EU-Budgets als Anwendungsbeispiel abstellt, 
gerät auch ein möglicher Einfluss des BDGS in den Blick. KI-Anwendungen, 
die auf der Sammlung und Auswertung von digitalen Daten basieren und als 
Grundlage von Politikentscheidungen auf Ebene der EU dienen, verbinden die 
vermeintlichen Vorzüge digitaler Daten mit einer Ausschaltung menschlicher Ein- 
flüsse auf die Entscheidungsfindung, wie etwa politische oder soziale Zwänge und 
menschliche Fehlwahrnehmungen. Personen, die einen ausgeprägten Glauben an 
das Potential digitaler Daten haben, sollten diese herausgestellten Vorzüge ent- 
sprechend wahrnehmen und mit Hilfe von ADM getroffenen Entscheidungen auch 
eine höhere Legitimität zusprechen. Ein ausgeprägter Glaube an den Erkenntnis- 
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und Nutzengewinn großer digitaler Datenbestände sollte demnach einen positi- 
ven Einfluss auf die wahrgenommene Legitimitdt mit Hilfe von ADM getroffener 
Entscheidungen haben. Es wird folgende Hypothese aufgestellt: 


Н2.1а: Je ausgeprägter das BDGS, desto höher die Wahrnehmung der 
Legitimität von ADM für Politikentscheidungen auf Ebene der EU. 


Um die Hypothese zu beantworten, wurde im Rahmen der experimentellen Befra- 
gungsstudie auch die BDGS-Skala eingesetzt, deren Einfluss auf die jeweiligen 
Legitimitätsdimensionen eingesetzter ADM-Anwendungen nachfolgend geprüft 
und berichtet wird. Dabei muss zur Prüfung der Einschätzung der Legitimität 
auch ein Szenario mit dem Status quo aufgenommen und durch die Befragten 
bewertet werden. In diesem werden politische Entscheidungen, wie es aktuell der 
Fall ist, von EU-Politiker*innen getroffen. In einer experimentellen Logik kann 
hier auch von der Kontrollgruppe gesprochen werden. 

Allerdings ist solch ein Anwendungsfall des ADM, in dem jegliche Ent- 
scheidungsfindung vollständig an eine KI-Anwendung ausgelagert wird, als 
Extremszenario zu sehen. Es ist unwahrscheinlich, dass demokratisch legitimierte 
politische Handlungsfreiheit direkt außer Kraft gesetzt und durch ein techni- 
sches System abgelöst wird. Vielmehr sollen Systeme der KI als unterstützende 
Anwendungen herangezogen werden, die eine Entscheidungsfindung befördern 
und vorbereiten. Es stellt sich mithin die Frage, inwieweit ADM akzeptiert wird, 
jedoch aus Sicht der Bürger*innen menschliche Aufsicht und Interventionsfä- 
higkeit bewahrt bleiben sollten, also eine Form hybrider Entscheidungsfindung 
begrüßt wird. Auch in diesem Rahmen wird erwartet, dass Personen mit einem 
hohen Glauben an die Wirkmächtigkeit digitaler Daten einem solchen Anwen- 
dungsfall datenbasierter KI-Anwendungen eine höhere Legitimität zusprechen. 
Entsprechend wird folgende Hypothese aufgestellt: 


Н2.1Ь: Je ausgeprägter das BDGS, desto höher die Wahrnehmung der Legitimi- 
tät von hybrider Entscheidungsfindung für Politikentscheidungen auf Ebene der 
EU. 
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Abbildung 10.1 Forschungsmodell Erhebung 2.1 EU und KI 


Um diese Hypothese zu prüfen, wurde zusätzlich ein weiteres Szenario hybrider 
Entscheidungsfindung evaluiert, das eine Art Zwischenstufe zwischen dem Sta- 
tus quo und einer rein datenbasierten KI-Anwendung darstellte. Die Hypothesen 
und spezifizierten Zusammenhänge wurden mit Hilfe einer Befragung mit experi- 
mentellem Design geprüft, wofür für das in Abbildung 10.1 spezifizierte Modell 
geschätzt wurde. 


10.3.2 Erhebung 2.2 - Die Bedrohungswahrnehmung von 
Künstlicher Intelligenz 


Zwischen Ende September und Anfang Oktober 2019 wurde zusammen mit 
Kimon Kieslich und Prof. Dr. Frank Marcinkowski am Lehrstuhl KMW I eine 
weitere Befragungsstudie mit dem Kurztitel TAI (Threat perceptions of АГ) 
durchgeführt, in deren Rahmen Erhebung 2.2 KI-Bedrohung stattfand. Diese hatte 
eine Skalenkonstruktion für eine standardisierte funktions- und anwendungs- 
orientierte Messung der Bedrohungswahrnehmung durch KI zum Ziel. Weitere 
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Informationen finden sich bei Kieslich et al. (2021). Im Rahmen dieser Befra- 
gungsstudie kam erneut die BDGS-Skala zum Einsatz. Aufgrund des explorativen 
Charakters der Studie und der sich mehrfach bestätigten Struktur des BDGS und 
der Ausprägung seiner Dimensionen wurde keine Präregistrierung durchgeführt. 

Im Vordergrund des Erkenntnisinteresses stand hier eine differenzierte Mes- 
sung der Bedrohungswahrnehmung durch KI in Abhängigkeit von den Funktio- 
nen sowie den Einsatzgebieten der KI. Ausgangspunkt ist also die Analyse einer 
affektiven Komponente der Einstellung gegenüber datenverarbeitender KI (Maio 
et al., 2018). Geht es im Rahmen der Mensch-Maschine-Interaktion um Affekte, 
so wird häufig auf eine Bedrohungswahrnehmung und hierauf begründete Ängste 
Bezug genommen: So untersucht bspw. auch die Technikakzeptanzforschung 
Bedrohungspotentiale und durch sie ausgelöste Ängste nicht nur im Hinblick 
auf Großtechnologien wie Atomkraft, Nano- oder Biotechnologie, sondern insbe- 
sondere auch auf Computertechnik (Bauer, 1995a).* Mit Blick auf KI hat dabei 
unlängst die Arbeit von Liang und Lee (2017) die Ängste der US- Bürger*innen 
vor autonomen Robotern und KI untersucht. Sie kommen zu der Einschätzung, 
dass rund ein Viertel der Befragten in der repräsentativen Stichprobe aus dem 
Mai 2015 Angst vor KI äußert. Auch für Deutschland zeigen aktuelle Zahlen von 
Bitkom (2018b), dass neben überwiegender positiver Erwartungen an KI bei man- 
chen Menschen in Deutschland auch etwaige Befürchtungen mit KI verbunden 
sind und ein Drittel der Befragten KI als Gefahr sieht. 

Es zeigt sich, dass etliche Bürger*innen eine Bedrohung durch KI und 
autonome Roboter äußern, also affektive Reaktionen durchaus relevant für 
Einstellungsbildung gegenüber KI sein können. Es ist daher notwendig, die 
Konsequenzen des BDGS auch und insbesondere in Verbindung mit den affek- 
tiven Wahrnehmungskomponenten von datenbasierter KI zu beleuchten. Es ist 
anzunehmen, dass die Prädisposition des BDGS je nach Ausprägung zu einer 
unterschiedlichen Bedrohungswahrnehmung führen könnte. Personen mit ausge- 
prägtem Glauben an die Potentiale von digitaler Datensammlung und -auswertung 
mögen auch hierauf aufbauende Computertechnik als weniger bedrohlich empfin- 
den. Zunächst gilt es jedoch genauer herauszuarbeiten, warum und in welchem 
Zusammenhang genau Computertechnik im Form von KI und autonomen Robo- 
tern als Bedrohung empfunden werden könnte. 


4 Bauer unterscheidet hier zwischen genereller Technophobie, die sich auch auf Flugzeuge, 
Eisenbahnen etc. beziehen kann, und Cyberphobie, die sich explizit auf den privaten, schuli- 
schen und beruflichen Computergebrauch bezieht. Aufgrund der ungebräuchlichen Verwen- 
dung des Cyberbegriffs wird hier daher allgemein von Computerphobie gesprochen. 
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Die Bedrohungswahrnehmung durch Computertechnik 

Bauer (1995a) äußert im Rahmen der Forschung zu Computerphobie (die selbst- 
verständlich weiter gefasst ist als bloße Angstgefühle) folgende Skepsis, die auch 
für die vorliegende Studie zur Skalenkonstruktion der Angstmessung zunächst in 
Betracht gezogen werden muss: 


Most empirical research works with operational definitions of computer phobia [sic] 
using self-report rating scales. (...) However, a test score is an insufficient criterion for 
real ‘cyberphobia’; it can at best efficiently reproduce a pre-existing expert judgement, 
which, as it seems, is more suggested by popular expectations, than by insisting on 
phenomenological evidence. (S. 102-105) 


Bauer verweist darauf, dass die meisten Phobien eine Prävalenzrate von bis 8 % 
für ein Jahr und 13 % über den Lebenszeitraum haben (1995a). Angstgefühle sind 
ein Symptom von Phobien und eine Diagnose daher nicht so voraussetzungsvoll 
wie bei Letzterer. Dennoch sollte im Lichte mangelnder Validität der Messung 
von Angst durch Selbstauskunft eine Pathologisierung der Befragten und eine 
Sensationalisierung der Ergebnisse vermieden werden. Das bedeutet nicht, dass 
Bedrohung und Angstwahrnehmung nicht vorhanden sind, sondern ist als Auftrag 
zu verstehen, einen differenzierteren Messansatz zu verfolgen, der (a) auf wei- 
terführende Vergleiche mit zusätzlichen Messansätzen und Datenpunkten (bspw. 
physiologischen Messungen) zurückgreift und (b) über die Selbstauskunft einer 
allgemein wahrgenommenen Bedrohung hinausgeht und die wahrgenommene 
Bedrohung zusätzlich in Bezug zum Bedrohungsobjekt und seiner angstauslösen- 
den Eigenschaften setzt. Die vorliegende Untersuchung stellt dabei insbesondere 
auf letztere Anforderung an den Forschungszusammenhang des Bedrohungs- und 
Angstempfindens ab. 

Generell ist die Messung von Angst durch Selbstauskunft zwar möglich, 
jedoch grob und nicht unproblematisch (Hersen, 1973; Kogan & Edelstein, 
2004; Lanyon & Manosevitz, 1966; Scherer, 2005). Angst äußert sich ins- 
besondere durch ein körperliches Erleben, welches physiologische Reaktionen 
beinhaltet, die wie angemerkt nur eingeschränkt durch Selbstauskunft erhoben 
werden können. Zudem sollte sorgfältig zwischen Bedrohungsobjekt und sei- 
nem Bedrohungspotential, wahrgenommener Bedrohung und hierdurch bedingter 
Angst unterschieden werden (Freeman & Freeman, 2012; Scherer, 2005). Nicht 
jede Bedrohungswahrnehmung löst auch zwingend Angst als emotionale Reak- 
tion aus (Witte, 1992, 1994). Neben Fragen zur theoretischen Unterscheidung 
zwischen Bedrohung und Angst sowie der reliablen und validen Erhebung von 
empfundener Angst gibt es jedoch eine weitere mögliche Einschränkung der 
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Reichweite der Befunde. Die durchaus hoch ausgeprägte Bedrohungswahrneh- 
mung durch КТ überrascht, hängt jedoch auch mit der vorliegenden Messung von 
Angst im Rahmen des Chapman Survey of American Fears zusammen (Liang & 
Lee, 2017). Das Erhebungsinstrument legt seinen Schwerpunkt nur teilweise auf 
eine allgemeine Bedrohungswahrnehmung durch KI-Systeme: Einer der vier Indi- 
katoren der Messung zielte explizit auf Roboter ab, die menschliche Arbeitsplätze 
ersetzen, und ein zweiter Indikator stellte auf das Vertrauen von anderen Personen 
in die Arbeit von KI ab. Gerade in diesem Bereich werden wiederholt mögli- 
che Zukunftsszenarien diskutiert, bei denen es mittelfristig zum Verlust einer 
großen Anzahl an Arbeitsplätzen und generell Konsequenzen für die Zukunft 
der Arbeit kommt (Bonin et al., 2015; Dengler & Matthes, 2015; Ford, 2015; 
Frey & Osborne, 2017; Hirsch-Kreinsen, 2015). Diese weitreichenden Prognosen 
finden anschließend Eingang in die Medienberichterstattung sowie die politische 
Debatte und können Ängste auslösen (Brynjolfsson & McAfee, 2015; Grass & 
Weber, 2016; Pellegrino, 2015). So äußerten bereits 2016 9 % der Berufstätigen 
in Deutschland Sorgen um ihren Arbeitsplatz (INSM, 2016). Die Verbreitung 
von Robotern in unterschiedlichen Branchen, gepaart mit einer zunehmenden 
medialen Aufmerksamkeit, wirft hier zum einen Fragen nach einer möglichen 
Veränderung der allgemeinen öffentlichen Wahrnehmung von künstlicher Intel- 
ligenz und autonomen Robotern auf (Gnambs & Appel, 2018). Sie bedarf zum 
anderen jedoch weiterführender Ansätze, die eine differenziertere Analyse eben 
jener wahrgenommenen Bedrohungspotentiale ermöglicht und hierbei zwischen 
Anwendungen und Anwendungsgebieten unterscheidet. Diese Fragen drehen 
sich dann nicht immer um den Einfluss von Computertechnik auf menschliche 
Arbeit, sondern ganz allgemein um die Konsequenzen des Vordringens daten- 
verarbeitender KI-Systeme auf Individuum und Gesellschaft in allen möglichen 
Lebensbereichen. 


Die Bedrohungswahrnehmung ausgehend von unterschiedlichen Funktionen von 
KI 

Es ist zu vermuten, dass es einen Unterschied macht, in welchem Rahmen und 
wofür KI eingesetzt wird. Dabei ist zum einen der Anwendungsbereich der KI 
gemeint, der im folgenden Abschnitt besprochen wird. Zum anderen ist es die 
Reichweite bzw. das Ausmaß, mit dem die Computertechnik in einer Situa- 
tion eingesetzt wird und einen Einfluss auf das Bedrohungsempfinden nehmen 


5 “The question asked ‘How afraid are you of the following?’ and the items included: ‘Robots 
that can make their own decisions and take their own actions,’ ‘Robots replacing people in the 
workforce,’ ‘Artificial intelligence,’ and ‘People trusting artificial intelligence to do work’.” 
(Liang & Lee, 2017, S. 381) 
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kann. So unterscheidet das von Bitkom (2018a) herausgegebene Periodensystem 
der KI auf Basis der Vorarbeit von Hammond (2016) zwischen den Fähigkeiten 
Assess, Infer und Respond, welche grob übersetzt werden können in Beurteilen, 
Schlussfolgern und Reagieren. Diese Fähigkeiten von KI lassen sich im Rahmen 
verschiedener Funktionen nutzen (P. Hofmann et al., 2020). Mit Blick auf den 
tatsächlichen Anwendungsfall dürfen die Funktionen der KI allerdings nicht zu 
feinteilig unterschieden werden, da ein Grundverständnis, aber auch die Fähigkeit 
der Unterscheidung auf den Seiten des Laien möglich sein muss. Es ist fraglich, 
ob bspw. das Reagieren der KI-Systeme tatsächlich wie von P. Hofmann et al. 
(2020) vorgeschlagen von technisch unversierten Befragten wie folgt unterteilt 
werden kann: 


e “Decision-making, i. e., choosing between known, discrete alternatives 

e Generating, 1. e., producing or creating something 

e Acting, i. e., executing goal-oriented actions (e.g., movement, navigate, 
control)” (P. Hofmann et al., 2020, S. 9). 


Dem Produzieren und der Bewegung liegen ja bspw. mitunter bereits getroffene 
Entscheidungen durch KI-Systeme zugrunde. Mit Blick auf den vorliegenden 
Untersuchungszusammenhang der Bedrohungswahrnehmung von KI-Systemen 
wurde daher zunächst vereinfacht unterschieden in die Erkennung/Identifikation 
von Mustern in den Daten und hierauf aufbauenden Vorhersagen für die Zukunft. 
Weiterhin besteht die Möglichkeit, dass die KI auf Basis der Mustererkennung 
und Vorhersage direkt eine Entscheidungsempfehlung abgibt oder gar die Ent- 
scheidung im Rahmen des ADM direkt selbst trifft (Burton et al., 2019; Lepri 
et al., 2018; Packin, 2019). Es wird davon ausgegangen, dass die unterschiedliche 
Reichweite und Konsequenz der Funktionen und die Autonomie des jeweiligen 
KI-Systems zu einer unterschiedlich hoch ausgeprägten Bedrohungswahrneh- 
mung führen. Mit Blick auf die gebotene Sparsamkeit der Modellierung und 
der Erwartung, dass insbesondere die weitreichenden und konsequenzbehafteten 
Ergebnisse des Einsatzes der KI zu einer stärker ausgeprägten Bedrohungswahr- 
nehmung führen, beschränkt sich die nachfolgende Analyse auf Empfehlungen 
und Entscheidungen durch KI. Erste Ergebnisse aus den Pre-Tests indizierten, 
dass die erhobenen Indikatoren bei diesen beiden Funktionen bessere Verteilungs- 
werte aufwiesen, während bei den weniger weitreichenden Funktionen geringere 
und einseitig ausgeprägte Verteilungswerte der jeweiligen Indikatoren zu beob- 
achten waren — die Bedrohungseinschätzung war zu gering und fast alle Befragten 
waren dieser Ansicht, so dass sich schiefe Verteilungen mit Boden- und Decken- 
effekten abbildeten (Ho & Yu, 2015). Im Folgenden werden daher nur die beiden 
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Funktionen der Empfehlung und der autonomen Entscheidung (ADM) durch die 
KI in den Blick genommen, da hier die größte Bedrohungswahrnehmung sowie 
ausreichende Varianz zwischen den Befragten vermutet werden. 


Die Bedrohungswahrnehmung ausgehend von unterschiedlichen Anwendungsbe- 
reichen von KI 

In Hinsicht auf die Bedrohungswahrnehmung von KI und autonomen Robotern ist 
auch zwischen den Anwendungsbereichen zu unterscheiden, in denen KI-Systeme 
eingesetzt werden. Hier lässt sich an das eingangs erwähnte Arbeitsmarkt-Beispiel 
anknüpfen. So spielen KI-Systeme mit Bezug auf die Ökonomie und wirtschaft- 
liche Entwicklungen in der öffentlichen Diskussion eine große Rolle. Brennen 
et al. (2018) finden in einer Medieninhaltsanalyse der Berichterstattung in Groß- 
britannien, dass fast 60 % aller Berichte auf kommerzielle KI-Anwendungen 
aus der Industrie abstellen. Diese werden dabei nicht immer als nur positiv 
diskutiert. Zwar werden in vielen Wirtschaftsbereichen mittel- und langfristig 
Nutzengewinne erwartet (Brynjolfsson et al., 2017). Jedoch lassen sich wie bereits 
angedeutet in einigen Branchen negative Konsequenzen gerade für die Beschäf- 
tigten in Niedriglohnstufen erwarten (Furman & Seamans, 2019). Doch auch 
in anderen ökonomischen Zusammenhängen, beispielweise für Bürger*innen in 
ihrer Rolle als Kund*innen, zeigen sich mitunter bereits Problemlagen ab: Etwa 
wenn die KI-Systeme auf Datengrundlage individuell nachteilige Entscheidun- 
gen treffen, wie bei der Kreditvergabe oder Bewerbung um einen Studien- oder 
Arbeitsplatz (siehe auch Erhebung 2.4 KI und Hochschule in Abschnitt 10.3.4). 
Ganz gleich, ob diese Entscheidungen objektiv haltbar und ohne Bias sind oder 
nicht und ob die Betroffenen dies entsprechend bewerten oder überhaupt ein- 
schätzen können: Der zunehmende Einsatz von KI und autonomen Robotern 
in der Wirtschaft bringt vermeintlich großen individuellen und gesellschaftli- 
chen Nutzen gepaart mit potentiell negativen Konsequenzen. Je nach Szenario 
und individueller Perspektive ist hier mitunter ein hohes Bedrohungspotential 
vorhanden, da auf weitreichende nachteilige Veränderungen in einem zentralen 
Lebensbereich abgestellt wird. So fällt dann auch möglicherweise die wahrge- 
nommene Bedrohung durch KI innerhalb eines Anwendungsbereichs je nach 
konkreter Anwendung höher oder gar niedriger aus. Das Bedrohungspotential 
von KI-Systemen ist mithin kontextabhängig und unterscheidet sich mutmaßlich 
auch in der Bedrohungswahrnehmung im Vergleich mit Anwendungsbereichen, 
die ebenso existentiell für den Menschen sind wie bspw. die Medizin. Wie im 
Hinblick auf die individualisierte Krankenversicherung in Erhebung 2.3 Kran- 
kenversicherung noch thematisiert wird (siehe Abschnitt 10.3.3), verbinden sich 
mit dem Einsatz von KI-Systemen in der medizinischen Forschung und Gesund- 
heitsversorgung ebenfalls durchaus große Hoffnungen. Gleichsam kommt es 
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auch hier zu Problemen, etwa in Hinsicht auf das Vertrauen in therapeutische 
Entscheidungen im Arzt-Maschine-Patientenverhältnis (Topol, 2019). 

Diese Diskussion neuer Problemlagen im Rahmen der Einführung von KI- 
Systemen in unterschiedlichen Lebensbereichen macht deutlich, dass eine Ana- 
lyse des wahrgenommenen Bedrohungspotentials auf Seiten der Bürger*innen 
immer einen jeweils spezifischen Zuschnitt haben muss und folglich auch stan- 
dardisierte Erhebungsinstrumente flexibel an das jeweilige Forschungsinteresse 
anpassbar sein müssen. Deshalb wurde die Skalenentwicklung auch vorangetrie- 
ben, um eine verbesserte standardisierte Messung der Bedrohungswahrnehmung 
zu produzieren, die auf möglichst viele Kontexte angewandt werden kann. 
Getestet wurde die Skalenentwicklung für die drei aktuellen und relevan- 
ten Anwendungsbereiche des KI-Einsatzes in Medizin, Personalwesen und im 
Bankensektor. 


Der Einfluss der Prädisposition des BDGS auf die Bedrohungswahrnehmung durch 
КЇ 

Im Rahmen dieser Arbeit wird das BDGS als eine prädispositive Kognition 
der Bürger*innen behandelt, deren Ausprägung einen Einfluss auf Einstellun- 
gen und Verhalten in allen Bereichen hat, in denen digitale Technologien wie 
bspw. die KI im Entstehungs- und Verwertungskontext von digitalen Daten 
Anwendung finden. So ist auch mit Blick auf die Untersuchung der Bedrohungs- 
wahrnehmung der Funktionen von KI und deren Einsatz in unterschiedlichen 
Anwendungsbereichen zu vermuten, dass das BDGS einen Einfluss auf die affek- 
tive Komponente von Einstellungen nimmt und mithin die Einschätzung der 
Bedrohung durch KI beeinflusst. Allerdings gibt es keine genauen Annahmen und 
Hinweise, die zu einer Hypothesenbildung führen, dass eine spezifische Dimen- 
sion des BDGS (wie bspw. der erwartete individuelle Nutzen) sich stark auf die 
Bedrohungswahrnehmung auswirkt. Zumal auch hier mit Blick auf die Kontext- 
unterscheidung Unterschiede zu erwarten wären. Konkrete Annahmen würden 
daher lediglich einer intuitiven Erwartung an einen möglichen Zusammen- 
hang entspringen und wären nicht deduktiv aus der theoretischen Beschreibung 
etwaiger zugrunde liegender Mechanismen abgeleitet. Mithin wird für den unter- 
suchten Einfluss des BDGS als Prädisposition auf Seiten der Befragten auf deren 
Bedrohungswahrnehmung der KI folgende Hypothese aufgestellt: 


H2.2: Je ausgeprägter das BDGS, desto geringer die Bedrohungswahrnehmung 
des Einsatzes von Künstlicher Intelligenz. 
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Um die Hypothese zu beantworten, wurde im Rahmen der Befragungsstu- 
die der Skalenentwicklung auch die BDGS-Skala eingesetzt, deren Ergebnisse 
nachfolgend berichtet werden. Die aufgestellte Hypothese wurde mit Hilfe 
einer Befragung geprüft und hierfür das in Abbildung 10.2 dargestellte Modell 
geschätzt. 


Genauigkeit Wissensgewinn 


ND 
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ô б 


а Einstellung von Bewerber*innen 
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Individueller Gesellschaftlicher 
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Szenario Medizin: 


Behandlung einer Krankheit 


Kreditvergabe 


Abbildung 10.2 Forschungsmodell Erhebung 2.2 KI-Bedrohung 


10.3.3 Erhebung 2.3 - Big Data im 
Krankenversicherungssystem 


Wie Erhebung 2.1 EU und КЇ wurde auch Erhebung 2.3 Krankenversicherung 
im Rahmen eines Lehrforschungsprojekts im Bachelorstudiengang Sozialwis- 
senschaften im Wintersemester 2018/19 an der HHU Düsseldorf durchgeführt. 
Dabei besteht Erhebung 2.3 Krankenversicherung aus zwei Teilerhebungen, die 
nachfolgend als Teilerhebungen 2.3a und 2.3b ausgewiesen werden. Weitere Infor- 
mationen zu dieser derzeit noch nicht veröffentlichten Studie sind als Publikation 
in Vorbereitung (Lünich & Starke, 2020). 
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Individualdatenbasierte Krankenversicherungstarife 

Das Erkenntnisinteresse betraf den Anwendungsbereich datenintensiver KI- 
Anwendungen im Gesundheitswesen. Mit der Sammlung und Auswertung von 
Big Data sind insbesondere im Gesundheitswesen große Hoffnungen verbunden 
(Aitken et al., 2018; Bitkom Research, 2019). Nicht nur, dass ganz allgemein 
die medizinische Forschung von weitreichender Datensammlung und deren Aus- 
wertung profitiert. Auch die personalisierte, auf das Individuum abgestimmte 
Medizin ist auf dem Vormarsch (Eberbach, 2017). Gleichzeitig weckt die Samm- 
lung großer digitaler Datenbestände Begehrlichkeiten der Versicherungsbranche 
(Braun & Nürnberg, 2015). Es besteht die Erwartung, dass Versicherungsta- 
rife, die bislang nach dem Prinzip kollektiver Risikoübernahme funktionieren, 
noch feiner für die einzelnen Versicherten ausgesteuert oder gar Personen mit 
hohen Risiken gar nicht erst in einen Tarif aufgenommen werden. Während 
es in vielen Versicherungsklassen (wie z. B. in der Automobilversicherung) 
bereits weit fortgeschrittene Versicherungsmodelle gibt, bei denen laufend digitale 
Daten über die Versicherten erhoben werden (Arisov et al., 2019), experimen- 
tieren in Deutschland auch aufgrund strenger Datenschutzbestimmungen erst 
einige wenige Krankenkassen mit der Datensammlung, etwa mit verhaltensbasier- 
ten Versicherungstarifen zur Verhaltenssteuerung durch Bonussysteme (Braun & 
Nürnberg, 2015; Weichert, 2014). Versicherte werden für die Teilnahme an Pro- 
grammen belohnt, bei denen sie sich verpflichten, der Krankenversicherung ihre 
Daten bereitzustellen oder zumindest sich selbst zu beobachten, bspw. durch die 
Nutzung eines Fitnessarmbands, das laufend Daten über Vitalparameter erhebt, 
oder durch die manuelle Eingabe dieser Daten in eine Smartphone-App. 

Dies führt laut einer Stellungnahme des Deutschen Ethikrats (2017) zu der 


Sorge, dass die Annahme einer allen gemeinsamen Vulnerabilität gegenüber Krank- 
heitsrisiken, die nicht sicher zu antizipieren sind, als Grundlage der Solidargemein- 
schaft in der gesetzlichen Krankenversicherung und der fairen Vertragsgestaltung 
in der privaten Krankenversicherung infrage gestellt werden könnte. Dann könnten 
Niedrigrisikogruppen verstärkt die Solidargemeinschaft verlassen, wodurch für Letz- 
tere erhebliche Mehrbelastungen entstünden. (S. 34) 


Die angesprochenen Niedrigrisikogruppen wären — so die Annahme — eher 
geneigt, auf die neuen individualisierten Krankenversicherungstarife umzusteigen, 
da sie hiervon überproportional profitieren würden. Der Gedanke folgt dabei einer 
einfachen Kosten-Nutzen-Kalkulation im Sinne der Rational-Choice-Logik (Diek- 
mann & Voß, 2004a; Kunz, 2004), bei der „Akteure in Entscheidungssituationen 
unter Restriktionen versuchen, ihre Präferenzen möglichst gut zu realisieren“ 
(Diekmann & Voß, 2004b, S. 15). Personen, die einen Nutzen aus den neuen 
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Versicherungstarifen ziehen, etwa indem sie Geld sparen, könnten eher geneigt 
sein, in individualisierte Krankenversicherungsangebote zu wechseln. 


Herausforderungen für den Datenschutz durch die Sammlung persönlicher Daten 

Gleichzeitig geht das Ausmaß der Datensammlung und -auswertung von perso- 
nenbezogenen Daten (seien es nun Daten über Vitalparameter o. ä.) mit großen 
Herausforderungen an den Datenschutz einher (Weichert, 2014). Zwar geben 
laut einer Untersuchung des Branchenverbands Bitkom (2019) aus dem Früh- 
jahr 2019 zwei Drittel der Smartphone-Nutzer*innen an, Gesundheits-Apps auf 
dem Handy zu nutzen. Dennoch zeigt sich mit Blick auf die Ergebnisse der 
gleichen Umfrage, dass bspw. für die Befürworter*innen der elektronischen Pati- 
entenakte Datenhoheit und -sicherheit zu den wichtigsten Anforderungen zählen 
oder dass 71 % der Befragten bei sogenannten E-Rezepten Risiken beim Daten- 
schutz und Datensicherheit sehen. Der Einfluss solcher Privatheitsbedenken auf 
die Datenpreisgabe und Selbstoffenbarung von Privatpersonen gibt daher immer 
wieder Anlass für dezidierte Forschung (Acquisti et al., 2015; Barth & Jong, 
2017; Baruh et al., 2017; Kokolakis, 2017). Auch hier spielen Kosten-Nutzen- 
Abwägungen eine Rolle, wobei mögliche oder bereits realisierte Nachteile bei 
Datensicherheit und Verletzungen der Privatsphäre sich auf der Kostenseite ver- 
buchen lassen (Bol et al., 2018). Als vorrangiges Erkenntnisinteresse der Studie 
wurde daher der Einfluss des individuellen Profits und der Notwendigkeit der 
Preisgabe persönlicher Daten auf die Wechselbereitschaft in einen individualisier- 
ten datenbasierten Krankenversicherungstarif mittels eines Experimentaldesigns 
untersucht. Damit rückt in der vorliegenden Erhebung mit der Verhaltensinten- 
tion der Wechselbereitschaft eine konative Komponente der Einstellung in den 
Fokus, deren Beeinflussung durch das BDGS fraglich ist. 


Der Einfluss des BDGS auf die Wechselbereitschaft in einen individualisierten 
Krankenversicherungstarif 

Mit Blick auf das BDGS ist zu prüfen, ob und inwieweit die individuelle Aus- 
prägung der Dimensionen des BDGS einen Einfluss auf die Verhaltensintentionen 
seiner Merkmalsträger hat, der über situative Einflussfaktoren hinausgeht. Wäh- 
rend also der realisierte Nutzen und die Notwendigkeit der Datenpreisgabe im 
Anwendungsbeispiel selbst variiert werden, wird das BDGS als verhältnismä- 
Big stabiles Wahrnehmungsmuster behandelt, das eben unabhängig der zuvor 
genannten Faktoren einen Einfluss auf die Bereitschaft zu einem Wechsel in 
eine individualisierte Krankenversicherung hat. Es steht zu erwarten, dass Per- 
sonen mit einem ausgeprägtem Glauben an die Potentiale von Big Data dem 
Ansatz eines auf Individualdaten basierenden Krankenversicherungstarifs offener 
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gegenüberstehen und daher eher gewillt sind, in einen solchen Tarif zu wechseln. 
Es wird daher mit Blick auf die Dimensionen des BDGS folgende Hypothese 
formuliert: 


H2.3: Je ausgeprägter das BDGS, desto höher ist die Wechselbereitschaft. 


Die Ausprägungen der BDGS-Dimensionen sind hierbei explizit nicht als Mode- 
rationsvariablen zu betrachten und werden dementsprechend als eigenständige 
exogene Variablen modelliert. Es wird davon ausgegangen, dass die Dimensionen 
des BDGS einen jeweils eigenständigen Einfluss zeitigen. Die aufgestellten Hypo- 
thesen werden nachfolgend mittels einer Befragung mit experimentellem Design 
geprüft und hierfür wird das in Abbildung 10.3 dargestellte Modell geschätzt. 


Genauigkeit 


Profit 
H2.3 Wissensgewinn 
Wechselbereitschaft 
Individueller 
Nutzen 
Datenabgabe 


Gesellschaftlicher 


Nutzen 


Abbildung 10.3 Forschungsmodell Erhebung 2.3 Krankenversicherung 


10.3.4 Erhebung 2.4 - Big Data und KI im Hochschulbereich 


Im Juni 2019 wurde im Rahmen eines MA-Seminars mit dem Titel ‚Sozialwis- 
senschaftliche Aspekte Künstlicher Intelligenz‘ unter der Leitung von Prof. Dr. 
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Marcinkowski eine Befragungsstudie unter Studierenden der HHU Düsseldorf zur 
Wahrnehmung des Einsatzes von KI-Anwendungen an der Hochschule durchge- 
führt. Ziel der Studie war es, zum einen herauszufinden, in welchen Bereichen 
der Universität (bspw. Lehre oder Verwaltung) der Einsatz von KI-Anwendungen 
befürwortet oder abgelehnt wird und welche der befürworteten Anwendungen als 
besonders nützlich erachtet werden. In dieser Studie, die im Befragungslabor des 
Lehrstuhls KMW I durchgeführt wurde, wurde u. a. auch die BDGS-Skala erho- 
ben. Weitere Informationen zur Studie finden sich in Kieslich et al. (2019) sowie 
Marcinkowski et al. (2020). 

Das Hauptaugenmerk der Studie, in deren Rahmen Erhebung 2.4 KI und 
Hochschule durchgeführt wurde, bestand dann erneut in der Wahrnehmung von 
datenbasierten KI-Anwendungen und nimmt nach dem Einfluss des BDGS im 
medizinischen Kontext und der Politik die Akzeptanz von KI-Anwendungen in 
einem weiteren zentralen und für viele, gerade jüngere Menschen lebensweisen- 
den Bereich in Augenschein: der höheren Bildung im tertiären Bildungsbereich an 
den deutschen Hochschulen. Es geht wiederum um die Bewertung des Einflusses 
von KI-Anwendungen, wobei dieses Mal keine direkt individual-ökonomischen 
oder gesellschaftspolitischen Konsequenzen die Bewertung beeinflussen. Die 
Konsequenz ist in der vorliegenden Studie breiter gelagert und betrifft die indivi- 
duelle (Entscheidungs-)Freiheit. Es geht genauer um die KI-basierte Vergabe von 
Studienplätzen. 


Die Einführung von KI-Anwendungen an der Hochschule am Beispiel des Studien- 
zulassungsverfahrens 
Im Zuge des Aufkommens von KI-Systemen geraten gerade auch solche Anwen- 
dungen in den Blick, die im Bildungssektor erfolgversprechend eingesetzt werden 
können (Attaran et al., 2018; Daniel, 2015; Eynon, 2013). Die vorliegende Studie 
sollte ganz allgemein ergründen, inwieweit in der Studierendenschaft Akzep- 
tanz für KI-basierte Zulassungsverfahren für Studiengänge besteht und welche 
Reaktionen mit der Einführung eines solchen Systems verbunden sind. 
Aufgrund limitierter Ressourcen und großem Andrang der Bewerber*innen 
auf eine unzureichende Anzahl an Studienplätzen in einigen Fächern sind hier- 
zulande seit jeher viele Studiengänge zulassungsbeschränkt und es muss in 
Bereichen wie etwa der Medizin oder Psychologie ein Studienzulassungsverfah- 
ren durchlaufen werden. Je nach Fach ist dieses Zulassungsverfahren bundesweit 
geregelt oder wird direkt von der jeweiligen Hochschule selbst festgelegt. Aktu- 
ell gibt es hierbei vorher festgelegte Kriterien (bspw. die Abiturnote im Rahmen 
des Numerus Clausus), die je nach Zulassungsverfahren um eignungsdiagnosti- 
sche Elemente ergänzt werden können, die unterschiedliche ‚harte‘ und ‚weiche‘ 
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Kriterien (bspw. Wissenstests sowie Motivationsschreiben oder unstrukturierte 
Interviews) umfassen (Klusmann et al., 2011; Stemmler, 2005). Dabei sind 
die entsprechenden Verfahren zeit- und ressourcenintensiv und gehen häufig zu 
Lasten des Forschungs- und Hochschulverwaltungspersonals. Denn die Einschät- 
zung der Studieneignung wird bei letzterem Verfahren in der Gesamtschau vom 
Menschen abgegeben, der Bewerbungen überblicken und bewerten muss. Eine 
Automatisierung der Eignungseinschätzungen könnte dabei nicht nur aus Grün- 
den des Bearbeitungsaufwandes von Vorteil sein. Denn die Eignung für ein 
Studium, die auf einer persönlicher Einschätzung der Bewerber*innen basiert, 
ist anfällig für Vorwürfe mangelnder Objektivität und kognitiver Verzerrungen 
im Rahmen der Bewertung (Dawes, 1971). Es wird mithin die Validität und Vor- 
hersagekraft dieser Verfahren bemängelt und kontrovers diskutiert (Hell et al., 
2007). 

Gleichzeitig gibt es jedoch auch Hinweise darauf, dass die Durchführung 
von Interviews neben Studierfähigkeitstests von Seite der Studieninteressierten 
durchaus positiv bewertet wird (Hell & Schuler, 2005). Kritisiert wird hier von 
Studierenden der mangelnde Informationsgehalt von Schulnoten und Leistungs- 
tests, welcher hingegen persönlichen Interviews zugeschrieben wird. Gleichzeitig 
haben Letztere jedoch eine negative affektive Wirkung, da Bewerbungsgesprä- 
che als „vergleichsweise wenig beruhigend und überdurchschnittlich unangenehm 
sowie als wenig durchschaubar eingeschätzt werden“ (Hell & Schuler, 2005, 
S. 370). Im Endeffekt bedeutet der derzeitige Zulassungsprozess viel Aufwand 
und Unsicherheit für die beteiligten Parteien, bei fraglichen Ergebnissen. Mit- 
hin wird hier oft diskutiert und erprobt Datenanalysesoftware einzusetzen (Maltz 
et al., 2007; Walczak & Sincich, 1999). 

Dabei sollen neuerdings Machine-Learning-Anwendungen auf einer breit- 
gefächerten Datengrundlage die vielversprechendsten Studienbewerber*innen 
identifizieren. Insgesamt, so die Hoffnung, soll dieser Computereinsatz den 
Zulassungsprozess effektiver und nicht zuletzt fairer gestalten. Es wird davon 
ausgegangen, dass für die Akzeptanz solcher Verfahren durch die betroffenen Stu- 
dienbewerber*innen insbesondere die wahrgenommene Fairness ausschlaggebend 


6 „Mit der nach dem 7. Gesetz zur Änderung des Hochschulrahmengesetzes nunmehr gül- 
tigen 20-20-60-Regelung (20 % der Studienplätze gehen in den bundesweit zulassungsbe- 
schränkten Studiengängen an die Abiturbesten, 20 % werden nach Wartezeit, 60 % von den 
Hochschulen im Rahmen eines Auswahlverfahrens selbst vergeben) bekommen die Univer- 
sitäten nun eine aktivere Rolle im Zulassungs- und Auswahlverfahren zugewiesen“ (Gold & 
Souvignier, 2005, S. 214). 


7 Für einen Überblick über die Debatte um Zulassungsverfahren siehe bspw. das Heft Nr. 2 
(2005) des Fachjournals Psychologische Rundschau, das sich des Themas annimmt. 
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ist (Marcinkowski & Starke, 2019), die daher mit Blick auf die Fairnessper- 
zeptionen der Studiereden auch im Fokus der vorliegenden Untersuchung stand 
(Marcinkowski et al., 2020). Neben allgemeinen Fairnessperzeptionen gegenüber 
dem Verfahren stellt dabei auch das Vertrauen in die Richtigkeit der Entscheidung 
eine Grundvoraussetzung für die positive Evaluation eines solchen Zulassungs- 
systems dar. Hier ist davon auszugehen, dass die Voreinstellungen gegenüber 
technologischen Innovationen einen Einfluss auf die Erwartungshaltung haben, 
die technische Anwendung könne die gemachten Versprechen auch tatsächlich 
einlösen. In der Argumentationslinie dieser Arbeit bedeutet dies, dass bezüg- 
lich der datenbasierten KI-Anwendungen, die im Rahmen der Studienzulassung 
an der Hochschule zum Einsatz kommen können, die Bewertung dieses Einsat- 
zes womöglich auch durch die generelle Wahrnehmung und Erwartungen an das 
Potential der Sammlung und Auswertung digitaler Daten beeinflusst ist. 


Vertrauen in die Richtigkeit der Entscheidung 

Wenn sich die Richtigkeit der getroffenen Auswahlentscheidung nicht direkt prü- 
fen lässt und eine Bewertung des Verfahrens mit Unsicherheit und gar dem Risiko 
behaftet ist, fälschlich nicht angenommen zu werden, bedarf es nach Mayer et al. 
(1995) Vertrauen in die Richtigkeit der von der Hochschule getroffenen Entschei- 
dungen: “The definition of trust (...) is the willingness of a party to be vulnerable 
to the actions of another party based on the expectation that the other will perform 
a particular action important to the trustor, irrespective of the ability to monitor 
or control that other party” (S. 712). Werden Studierende mit einem KI-basierten 
Eignungsfeststellungsverfahren konfrontiert, dessen Entscheidung sie unterwor- 
fen sind und dessen konkreten Auswertungsprozess sie nicht unmittelbar einsehen 
und hinterfragen können, wird erwartet, dass diejenigen Personen mit ausgepräg- 
tem Glauben an digitale Daten im Sinne dieser Arbeit auch ein höheres Vertrauen 
in die Richtigkeit der Entscheidung einer KI über Annahme oder Ablehnung für 
einen Studienplatz zeigen. Daher wird folgende Hypothese formuliert:® 


H2.4a: Je ausgeprägter das BDGS, desto höher das Vertrauen in die Richtigkeit 
der KI-basierten Auswahlentscheidung. 


8 In der Präregistrierung wurden die nachfolgenden Hypothesen H2.4a, H2.4b und H2.4c in 
einer Hypothese zusammengefasst und hier aus Gründen der übersichtlicheren Darstellung 
entsprechend aufgeteilt. Dabei wurden Hypothesenformulierungen und Modell angepasst, 
um den Fokus auf den Einfluss des BDGS zu verdeutlichen. Zudem wurde hier kein gerichte- 
ter Zusammenhang der Variablen Reputation der Hochschule und Protestneigung untersucht. 
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Erwartungen an die Genauigkeit digitaler Daten sind dabei eine zentrale Überzeu- 
gung innerhalb des BDGS. Sie äußern sich in einem Glauben an die Objektivität 
und Exaktheit der Daten. Es muss daher davon ausgegangen werden, dass es eben 
diese Überzeugung von der Genauigkeit digitaler Daten ist, die in besonderem 
Maße zur angenommenen Richtigkeit der zu treffenden Auswahlentscheidung 
führt. Der erwartete Erklärungsbeitrag dieser Überzeugung könnte sich daher 
von den anderen Dimensionen des BDGS unterscheiden. Es wird daher folgende 
Frage aufgeworfen: 


FF2.4: Unterscheidet sich der Einfluss der Überzeugungen von der Genauigkeit 
der Daten auf das Vertrauen in die Richtigkeit der Zulassungsentscheidung von 
denen anderen Dimensionen des BDGS? 


Ausgehend vom Vertrauen in die Richtigkeit der getroffenen Zulassungsentschei- 
dung interessiert nun aus Sicht der Hochschulen, die gedenken, ein KI-basiertes 
Zulassungsverfahren einzuführen, dessen Konsequenzen. Dabei rücken zwei 
Variablen in den Blick: die Reputation der Hochschule und die Reaktionen der 
Studierenden. 


Die Reputation der Hochschule 

Die Reputation der Hochschule in der Öffentlichkeit und insbesondere bei Stu- 
dienbewerber*innen ist ein wichtiges Gut im Wettbewerb der Universitäten um 
den akademischen Nachwuchs. Ein guter Ruf lockt geeignete Kandidat*innen 
(Bowman & Bastedo, 2009; Comm & LaBay, 1997; Theus, 1993). Mit hohen 
Bewerbungszahlen gehen die Möglichkeit der Selektivität der besten Köpfe und 
die universitätsinterne Daseinsrechtfertigung von Studiengängen einher. Von der 
Ausschöpfung der Lehrkapazitäten hängen zugewiesene Stellenprozente und Mit- 
telzuwendungen ab. Ein gutes Image bei den Bewerber*innen ist mithin ein 
gewichtiger Kredit, den die Universitäten und ihre Fakultäten nicht verspielen 
und möglichst erhöhen wollen (Habicht, 2009; Probst, 2008). 

Ein Vertrauen in die Richtigkeit der Entscheidung sollte dahingehend die 
Bewertung der Reputation der Hochschule besser ausfallen lassen bzw. sollte 
eine geringe Vertrauensneigung dazu führen, dass die Reputation der Hochschule 
sinkt. Nach Hosmer (1995) ist Reputation insbesondere die Konsequenz vertrau- 
enswürdigen Verhaltens. Zusammen mit dem BDGS wird hier ein Einfluss auf die 
Reputation vermutet, wenn etwa Studierende, die einen ausgeprägten Glauben an 
die digitalen Daten haben, auch die Einführung datenbasierter Anwendungen zur 
Studienplatzvergabe gutheißen. Die Hochschule sollte bei diesen Studierenden 
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durch die Einführung dieser innovativen KI-Anwendung an Reputation gewinnen. 
Daher wird die folgende Hypothese aufgestellt: 


H2.4b: Je ausgeprägter das BDGS, desto höher die Reputation der Hochschule, 
die eine KI-basierte Auswahlentscheidung einführt. 


Protestneigung der Studierenden gegen die KI-basierte Auswahlentscheidung 

Auch die Reaktion der Studierenden ist für die Hochschulen von Interesse. Evo- 
ziert der Einsatz automatisierter Auswahlentscheidungen Kritik und Einwände 
in der Studierendenschaft? In diesem Zusammenhang sollte sich dabei ebenso 
ein Einfluss des ВРС feststellen lassen. Da Studierende mit ausgeprägtem 
Glauben an die digitalen Daten, auch die vermeintlichen Vorteile datenbasierter 
KI-Anwendungen zur Studienplatzvergabe wahrnehmen, sollten sie eine gerin- 
gere Protestneigung zeigen. In diesem Zusammenhang wird auch der Einfluss des 
Vertrauens von Personen auf ihr Protestverhalten untersucht (Camaj, 2014; Moy 
et al., 2005; Moy & Pfau, 2000). Dabei zeigt sich, dass sich hohes Vertrauen nega- 
tiv auf die Protestneigung auswirkt (Moy et al., 2005; Nilson & Nilson, 1980). 
Unter der Annahme, dass abhängig von der Ausprägung des BDGS und des 
Vertrauens in die Richtigkeit der Entscheidung Akzeptanz des KI-basierten Aus- 
wahlverfahrens besteht, ist letztlich zu erwarten, dass dies eine geringere Absicht 
des Protests gegen den Einsatz des KI-basierten Auswahlverfahrens durch die 
Hochschule nach sich zieht. Es wird mithin folgende Hypothese aufgestellt: 


Н2.4с: Je ausgeprägter das BDGS, desto geringer die Protestneigung gegen eine 
KI-basierte Auswahlentscheidung. 


Es ist darüber hinaus fraglich, inwieweit die Reputation der Hochschule und die 
Neigung zum Protest gegen die Auswahlentscheidung zusammenhängen. Es kann 
durchaus erwartet werden, dass es hier einen möglichen Zusammenhang gibt, 
allerdings ist dessen Richtung fraglich und wird im Rahmen des vorliegenden 
Forschungsinteresses nicht näher untersucht. 

Die zu testenden Zusammenhänge finden sich in einem in Abbildung 10.4 
dargestellten und nachfolgend spezifizierten und geschätzten Modell, welches mit 
Hilfe einer Befragungsstudie geprüft wurde. 
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Abbildung 10.4 Forschungsmodell Erhebung 2.4 KI und Hochschule 


10.4 Präregistrierung 


Mit Blick auf die durchgeführten Studien wurden im Rahmen des Dissertations- 
projekts erste Erfahrungen mit der Präregistrierung von empirischer Forschung 
gesammelt. Im Zuge der sogenannten Replikationskrise in den Sozialwissenschaf- 
ten etabliert sich nach und nach die Präregistrierung von empirischen Studien 
(Dienlin et al., 2020; Humphreys et al., 2013; Simmons et al., 2011). Da viele 
Zusammenhänge bei der Wiederholung von Studien nicht erneut beobachtbar 
sind (Ioannidis, 2005), soll die Präregistrierung sicherstellen, dass das empiri- 
sche Vorgehen, die Hypothesen sowie die Datenauswertung, die die Hypothesen 
prüft, im Voraus festgelegt werden. Dieses Vorgehen soll verhindern, dass Daten- 
sätze, Variablen und Konstrukte beliebig angepasst werden, bis sich erwartete, 
insbesondere positive Ergebnisse zeigen (Fanelli, 2010; Wagenmakers et al., 
2012). 

Die jeweilige Untersuchungsanlage der Studien, in deren Rahmen Erhebung 
2.1 EU und KI sowie die Erhebung 2.3 Krankenversicherung (hier Teilerhe- 
bung 2.3b) durchgeführt wurden, wurde vor der Datenerhebung einzeln prä- 
registriert. Dabei wurden das Studiendesign samt Hypothesen, die erhobenen 
Variablen sowie das Vorgehen bei der Datenauswertung festgelegt. Nähere Infor- 
mationen hierzu finden sich in den jeweils untenstehenden Quellenverweisen für 
die Studien. 
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Darüber hinaus wurde speziell für die vorliegende Arbeit eine gemeinsame 
zusätzliche Präregistrierung von Erhebung 2.1 EU und KI und Erhebung 2.3 
Krankenversicherung auf der Plattform der Open Science Foundation (OSF) 
durchgeführt, wobei zunächst lediglich zwei Hypothesen mit Blick auf die 
Ausprägung des BDGS formuliert wurden, die im nachfolgenden Abschnitt 
besprochen werden. Die Präregistrierung wurde am 23. April 2019 durchgeführt.” 
Zu diesem Zeitpunkt waren die Daten von Erhebung 2.1 EU und KI zwar bereits 
erhoben, es wurde jedoch noch von niemandem auf den Datensatz zugegriffen. 
Es fand also noch keine Datenbereinigung oder sonstige Datenanalyse statt. Die 
Daten von Teilerhebung 2.3b Krankenversicherung waren zu diesem Zeitpunkt 
noch nicht erhoben. 

Das Studiendesign samt Hypothesen für Erhebung 2.4 KI und Hochschule, die 
dort erhobenen Variablen und das Vorgehen bei der Datenauswertung wurden 
am 15. Juni 2019 bei OSF präregistriert.!" Die Hypothesen bezüglich des BDGS 
wurde analog zu den Erhebungen 2.1 und 2.3 aufgestellt. Zudem wurde das finale 
Auswertungsmodell festgelegt, das nachfolgend beschrieben wird. Die Datenaus- 
wertung, die über die präregistrierten Hypothesen hinausgeht, ist nach strenger 
Auslegung als explorativ zu betrachten, folgt allerdings konsistent der Grundan- 
nahme der vorliegenden Arbeit, dass sich ein ausgeprägter Glaube positiv auf 
kognitive, affektive und konative Komponenten der Einstellungen auswirkt. 


10.5 Feldphasen, Sample und Fragebogenaufbau 


10.5.1 Erhebung 2.1 EU und KI 


Die Befragung mit Experimentaldesign für Erhebung 2.1 EU und KI wurde als 
Online-Befragung konzipiert und Befragte wurden über das SoSci-Panel rekrutiert 
(D. J. Leiner, 2016). Die Feldphase der Untersuchung lief vom 8. April bis zum 
22. April 2019. Es wurden insgesamt 2954 Einladungen an Personen aus dem 
SoSci-Panel versendet. Insgesamt wurde der Fragebogen 807-mal aufgerufen und 
729 Personen begannen mit der Befragung. Davon füllten 612 Teilnehmer*innen 
den Fragebogen vollständig aus, was einer Beantwortungsrate von 20,7 % ent- 
spricht. Zur Qualitätskontrolle der Daten aus dem experimentellen Design wurde 


9 Informationen zur Präregistrierung sind unter folgendem Link zu finden: https://osf.io/ 
gyn7k/?view_only=c58a5e1b4a804b488aceec24d05dc9al 


10 Informationen zur Präregistrierung sind unter folgendem Link zu finden: https://osf.io/ 
83t7s/?view_only=8accal 93bba04e169b9 1534f74ced263 


10.5 Feldphasen, Sample und Fragebogenaufbau 209 


eine gründliche Datenbereinigung durchgeführt. Es wurden Befragte ausgeschlos- 
sen, die eine Aufmerksamkeitsprüfung nicht erfolgreich beantwortet haben, bei 
der ein eingebauter Attention Check nach dem Thema des Stimulus fragte (n 
= 14). Zudem wurden Befragte von der Analyse ausgeschlossen, die sich zu 
schnell durch den Fragebogen geklickt haben. Hierfür wurde die von SoSci Survey 
bereitgestellte Variable DEG_Time herangezogen, die für alle Teilnehmer*innen 
automatisch im Datensatz gespeichert wurde.'! Es werden für zu schnelles Beant- 
worten der Fragen und Durchklicken der Fragebogenseiten hierbei Maluspunkte 
vergeben, die bei einem konservativ festgelegten Wert von 50 zum Ausschluss 
führen (n = 26). Mit diesem Filterverfahren bestand die Stichprobe aus n = 572 
Befragten. 

Die BDGS-Skala fand sich auf Seite 5 von 22 Fragebogenseiten (siehe Fra- 
gebogen im Anhang 3.4 im elektronischen Zusatzmaterial). Direkt im Anschluss 
folgte eine Überleitung zum experimentalen Stimulus, der im Abschnitt 10.6.1 
beschrieben wird. Die Befragten wurden randomisiert einer von drei Konditionen 
zugewiesen, in denen ein unterschiedlicher Budgetierungsprozess auf EU-Ebene 
dargestellt wurde. Anschließend gaben sie ihre Einschätzung zur Legitimität 
des Prozesses ab und beantworteten Fragen zum Stimulus im Rahmen einer 
Manipulationsprüfung. 


10.5.2 Erhebung 2.2 KI-Bedrohung 


Die Feldphase lief vom 30. September bis zum 14. Oktober 2019. Rekrutiert 
wurden die Befragten auch in dieser Studie über das SoSci-Panel (D. J. Leiner, 
2016). Die Befragten aus dem Panel-Pool wurden von den SoSci-Administratoren 
zur Befragung eingeladen, wobei 4919 Einladungen erfolgreich versendet werden 
konnten. Es gab keine Incentivierung oder Vergütung fiir die Teilnahme an der 
Studie. Insgesamt wurde der Fragebogen 1046-mal aufgerufen und 1026 Per- 
sonen begannen mit der Befragung. Davon füllten 917 Teilnehmer*innen den 
Fragebogen vollständig aus, was einer Beantwortungsrate von 18,6 % entspricht. 
Davon wurden n = 26 Fälle von der Auswertung ausgeschlossen, da sie auch hier 
entweder mehr als 50 Maluspunkte für extrem schnelles Ausfüllen des Fragebo- 
gens erhielten oder den Fragebogen in weniger als fünf Minuten beantworteten. 


П Für mehr Informationen zu den Maluspunkten, die mittels der DEG_TIME von SoSci Sur- 
vey erhoben werden, siehe die SoSci-Dokumentation (D. J. Leiner, 2019b) unter: https:// 
www.soscisurvey.de/help/doku.php/de:results:variables [zuletzt aufgerufen am 24. Oktober 
2019] 
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Dieses Zeitkriterium wurde durch Prüfung im Rahmen des Pre-Tests des Fragebo- 
gens als Mindestwert festgesetzt, der erreicht werden musste, um von sinnhafter 
Beantwortung ausgehen zu können. Letztendlich gingen n = 891 Fälle in die 
Auswertung ein. Die Geschlechtsverteilung ist mit 50.0 % Frauen, 49.2 % Män- 
ner sowie 0.8 % Befragten, die sich der diversen Geschlechtskategorie zuordnen, 
im Gesamtsample und auch in den einzelnen Gruppen ausgeglichen. Das Durch- 
schnittsalter betrug 46 Jahre (SD = 15.66). Aufgrund der demografischen Struktur 
des Online-Access-Panels von SoSci haben 82 % der Befragten mindestens den 
Bildungsabschluss Abitur. 

Die Befragten wurden per Zufall einer von drei Anwendungsbereichen von КТ 
(Medizin, Personalwesen oder im Bankensektor) zugelost und bekamen dement- 
sprechend angepasste Items zur Beantwortung vorgelegt (siehe Abschnitt 10.6.2, 
der Fragebogen findet sich in Anhang 3.5 im elektronischen Zusatzmaterial). Von 
den n = 891 Fällen fanden sich 301 Befragte in der Gruppe ‚Medizin‘, 294 in der 
Gruppe ‚Personalwesen‘ und 296 in der Gruppe ‚Bankensektor‘. Die Platzierung 
auf der sechsten Fragebogenseite und die Formulierungen BDGS-Skala waren in 
den drei Konditionen gleich, lediglich die zwölf Items der Skala wurden zufällig 
in der präsentierten Reihenfolge rotiert. 


10.5.3 Erhebung 2.3 Krankenversicherung 


Zu Beginn des Jahres 2019 erfolgte in Teilerhebung 2.3a Krankenversicherung 
eine Befragung im Labor, bei der Studierende der HHU unter Laborbedingungen 
an der Befragung mit Experimentaldesign teilnahmen. Im April begann dann für 
Teilerhebung 2.3b Krankenversicherung eine zweite Befragung mit Experimental- 
design, die als Online-Befragung konzipiert war und für die wie in Erhebung 2.1 
EU und КЇ und Erhebung 2.3 Krankenversicherung Befragte über das SoSci-Panel 
rekrutiert wurden (D. J. Leiner, 2016). 


Laboruntersuchung Teilerhebung 2.3a Krankenversicherung 

Die Feldphase der Teilerhebung 2.3a Krankenversicherung lief vom 9. Januar bis 
zum 21. Januar 2019. Rekrutiert wurden die Befragten auf dem Campus der HHU 
durch direkte Ansprache und das Verteilen von Werbeflyern. Für die Teilnahme 
an der Studie erhielten alle Probanden nach Abschluss der Befragung fünf Euro. 
Die Teilnahme erfolgte im Labor, so dass zeitgleich bis zu vier Probanden an 
einem jeweils gleich aufgebauten Computerterminal teilnehmen konnten. Insge- 
samt nahmen n = 164 Personen erfolgreich an der Laborbefragung teil und es 
wurden keine Fälle aus dem Datensatz vor der Auswertung entfernt. 
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Online-Befragung Teilerhebung 2.3b Krankenversicherung 

Die Feldphase der Teilerhebung 2.3b Krankenversicherung lief vom 24. April 
bis zum 24. Juni 2019. Rekrutiert wurden die Befragten über das SoSci-Panel 
(D. J. Leiner, 2016). Die Befragten aus dem Panel-Pool wurden von den SoSci- 
Administratoren zur Befragung eingeladen. Es gab keine Incentivierung oder 
Vergütung für die Teilnahme an der Studie. Insgesamt wurde der Fragebogen 
928-mal aufgerufen. Es begannen 614 Personen mit der Beantwortung, wobei n 
= 455 Personen den Fragebogen vollständig beantworteten. Davon wurden n = 
22 Fälle von der Auswertung ausgeschlossen, da sie mehr als 50 Maluspunkte 
für extrem schnelles Ausfüllen des Fragebogens erhielten. Letztendlich gingen n 
= 433 Fälle in die Auswertung ein. 

Der Fragebogen war in beiden Teilerhebungen nahezu identisch aufgebaut 
(siehe Fragebogen im Anhang 3.6 im elektronischen Zusatzmaterial). Da in 
Teilerhebung 2.3a Krankenversicherung die Darstellung auf den PCs im Labor 
feinjustiert werden konnte, wurden die Skalen in Teilerhebung 2.3b Krankenver- 
sicherung anders auf die Seiten verteilt, um mögliche Darstellungsprobleme auf 
den eventuell kleineren Bildschirmen von Privatgeräten der Befragten zu vermei- 
den. Es wurde in der Panelbefragung explizit dazu aufgefordert, den Fragebogen 
nicht an einem Smartphone oder einem Tablet auszufüllen, da dort Darstellungs- 
probleme mit Blick auf die dynamischen Elemente erwartet wurden. Es wurde 
von der Fragebogensoftware registriert, mit welchem Gerät auf den Fragebogen 
zugegriffen wurde. Wurde als Gerät ein Smartphone oder ein Tablet erkannt, war 
eine Beantwortung in diesem Fall nicht möglich und die Probanden bekamen eine 
Aufforderung, den Link am Desktop-Computer zu öffnen. Die Reihenfolge der 
Skalen wurde beibehalten. Der Fragebogenaufbau war in beiden Studien annä- 
hernd gleich. Zu Beginn der Befragung wurde den Befragten ein Text vorgelegt, 
in dem zunächst ganz allgemein auf Entstehung und Verwertung digitaler Daten 
im Rahmen der Digitalisierung eingegangen wurde (der vollständige Text findet 
sich im Anhang 3.6 im elektronischen Zusatzmaterial). 

Nach dieser Erklärung erfolgte eine Einführung in die Bedeutung dieser digi- 
talen Datensammlung für die Krankenversicherung und die Möglichkeit einer 
hieraus entstehenden Individualisierung von Versicherungstarifen. Ziel war es, 
alle Befragten allgemein über die Möglichkeiten der Datenverwertung in der 
Krankenversicherung aufzuklären. Anschließend begann die eigentliche Befra- 
gung, wobei im Rahmen des experimentellen Designs zunächst auf ein vor- 
gebliches Modellprojekt namens INDIVIDUA hingewiesen wurde. Für dieses 
Modellprojekt sollten die im Rahmen des ersten Teils der Befragung gemachten 
Angaben der Befragten zur Berechnung eines individualisierten Krankenkas- 
senbeitrags ausgewertet werden. Es folgten mithin zunächst Fragen zur Person 
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bestehend aus soziodemografischen Angaben, Versicherungsstatus, Gesundheits- 
status, Gesundheitsverhalten (Sportaktivität, Alkohol- und Zigarettenkonsum) 
sowie Einstellungsfragen. In diesem Block fand sich u. a. auch die BDGS-Skala. 
Diese wurde in Erhebung 2.3a auf Seite 11 und in Erhebung 2.3b auf Seite 13 
von 26 Fragebogenseiten gezeigt. Da sich vor der Beantwortung der BDGS-Skala 
nur Fragen zur Person der Befragten fanden, bezog sich lediglich eine Frage zur 
Häufigkeit der Computerspielnutzung auf die Nutzung digitaler Technik. Es sind 
daher keine besonderen Befragungseffekte auf die BDGS-Skala zu erwarten. 

Anschließend wurde auf Basis dieser Angaben eine Berechnung des indivi- 
dualisierten Krankenversicherungstarifs der INDIVIDUA simuliert. Als Ergebnis 
dieser vermeintlichen Berechnung wurde dann, nach einer voreingestellten Zeit 
von zehn Sekunden, die vermeintlich für die Berechnung des Tarifs nötig war, 
die eigentliche Manipulation (unabhängige Variable) ausgespielt. Abschließend 
folgten Fragen zur Wechselbereitschaft (abhängige Variable, siehe Variablen in 
Abschnitt 10.6.3) und Fragen zur Bewertung des deutschen Krankenversiche- 
rungssystems, allgemeine Einstellungsfragen zur Gesundheitsversorgung sowie 
eine Manipulationsprüfung. Am Ende wurden die Befragten über den experimen- 
tellen Charakter der Befragung in einem ausführlichen De-Briefing aufgeklärt 
und wurde sich dankend von ihnen verabschiedet. 


10.5.4 Erhebung 2.4 КЇ und Hochschule 


Die Feldphase der Befragung lief vom 17. bis zum 28. Juni 2019. Die Rekru- 
tierung der Befragten erfolgte durch Aushänge und direkte Ansprache von 
Studierenden auf dem Universitätscampus der HHU Düsseldorf durch Studie- 
rende aus dem Masterseminar. Ziel war es, Studierende aller Fachrichtungen zu 
erreichen. Die Teilnahme wurde mit fünf Euro pro Person vergütet. Insgesamt 
haben n = 305 Studierende an der Laborbefragung teilgenommen. Lediglich 
ein Fall musste von der Analyse ausgeschlossen werden, da die Bearbeitungs- 
zeit unrealistisch kurz war, so dass n = 304 Fälle in die Auswertung eingingen 
(Kieslich et al., 2019). 

Die BDGS-Skala fand sich auf Seite 14 von 20 Fragebogenseiten (siehe Frage- 
bogen im Anhang 3.7 im elektronischen Zusatzmaterial). Bevor die Befragten die 
Frageitems der BDGS-Skala beantworteten, wurden u. a. Fragen zum Einsatz von 
KI an der Hochschule gestellt, insbesondere die Bewertung solcher Anwendun- 
gen und die wahrgenommene Fairness der KI-gestützten Verfahrensweise, die im 
vorrangigen Erkenntnisinteresse der Studie standen. Es wurde hier darauf hinge- 
wiesen, dass KI Muster in den digitalen Daten erkennen, hieraus Schlüsse ziehen 
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und Vorhersagen treffen, die im vorliegenden Fall wiederum eine unmittelbare 
Auswirkung für die Studierenden hätten. Es könnte mithin davon ausgegangen 
werden, dass diese Ordnung einen Ausstrahlungseffekt auf die Beantwortung 
der BDGS-Skala hatte, da die Befragung zuvor auf KI-Verfahren abstellte. Mit 
dem vorliegenden Untersuchungsdesign lässt sich diese experimentell zu klä- 
rende Frage zwar nicht prüfen. Sie ist aufgrund der angenommenen Stabilität 
der Kognitionen des BDGS jedoch an dieser Stelle zu vernachlässigen. 


10.6 Operationalisierung der untersuchten Konstrukte 


10.6.1 Erhebung 2.1 EU und KI 


Unabhängige Variablen — die Manipulation des zu bewertenden Budgetierungspro- 
zesses auf EU-Ebene 

Als Stimulus erhielten die Befragten randomisiert einen von drei Texten, der 
den Budgetierungsprozess des EU-Haushalts beschrieb und in dem (a) in der 
Kondition der Kontrollgruppe nur Politiker*innen über den Haushalt berieten 
und diesen letztendlich verabschiedeten (Human Decision-Making, HDM), (b) 
ein KI-System ohne das Zutun von Politiker*innen den Haushalt aufstellte und 
dieser unverändert verabschiedet wurde (ADM) und (c) ein KI-System ohne das 
Zutun von Politiker*innen den Haushalt aufstellte, die EU- Politiker*innen die- 
sen dann jedoch noch einmal verhandelten und anpassen konnten, mithin also ein 
hybrides Modell der Politikgestaltung. Dabei basierte der Text auf einer Original- 
Vorlage von der offiziellen Webseite der EU (Europäische Union, 2019). Der 
Einführungstext, der in allen drei Konditionen gleich lautete, las sich wie folgt: 


Der Haushalt der Europäischen Union 

Der jährliche EU-Haushalt beläuft sich auf 160 Mrd. € (Stand: 2018). 
Dies ist absolut gesehen eine große Summe, macht jedoch nur 1,02 % der 
jährlichen Wirtschaftsleistung der EU aus. Das Geld aus dem EU-Haushalt 
wird in Bereichen eingesetzt, in denen es sinnvoll ist, zum Nutzen Europas 
als Ganzes Ressourcen zu bündeln. Beispiele hierfür sind: 


e der Ausbau der Verkehrswege, Energienetze und Kommunikationsver- 
bindungen zwischen den EU-Ländern, 
e der Schutz der Umwelt in ganz Europa, 


214 10 Studie 2 - Die Auswirkungen der ... 


e die Erhöhung der weltweiten Wettbewerbsfähigkeit der europäischen 
Wirtschaft, 

e die Förderung grenzüberschreitender Zusammenschlüsse europäischer 
Wissenschaftler und Forscher. 


Diesem Text folgte dann in jeder Kondition ein weiterer Textabschnitt, dessen 
unterschiedlicher Informationsgehalt die eigentliche Manipulation darstellte. 


Kondition 1: Status quo — Human Decision-Making durch EU-Politiker*innen 
(HDM) 

Fiir die Kondition des Status quo, in der die Politiker*innen alleine entschie- 
den (Kondition НОМ nachfolgend abgekürzt als kond#>™), wurde folgender 
Textbaustein angeschlossen: 


Wer entscheidet über die Verwendung der Mittel? 
Die Entscheidung über den Haushalt eines jeden Jahres erfolgt in zwei 
wesentlichen Schritten: 


1. In einem ersten Verfahren erarbeitet die Europäische Kommission einen 
Haushaltsentwurf und legt diesen den Regierungen der Mitgliedslän- 
der — vertreten im Rat der EU — und dem demokratisch gewählten 
Europäischen Parlament vor. 

2. Im Anschluss wird der Haushaltsvorschlag der Kommission im Euro- 
päischen Rat und im Europäischen Parlament debattiert, verhandelt und 
ggf. angepasst. Sobald der Vorschlag von allen beteiligten Institutionen 
angenommen wurde, steht der Haushalt des nachfolgenden Jahres. 


Kondition 2: Algorithmic Decision-Making durch KI-System (ADM) 

Für die Kondition, in der ein KI-System alleine den Haushalt aufstellte (Kondi- 
tion ADM nachfolgend abgekürzt als kond*>™), wurde folgender Textbaustein 
angeschlossen: 


Wer entscheidet über die Verwendung der Mittel? 
Die Entscheidung über den Haushalt eines jeden Jahres erfolgt in zwei 
wesentlichen Schritten: 
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1. In einem ersten Verfahren führen Hochleistungscomputer des Europäi- 
schen Rechnungshofs alle auf EU-Ebene verfügbaren Daten zusam- 
men. Beispiele hierfür sind verfügbare Struktur- und Verwaltungsdaten 
aus der EU und den einzelnen Mitgliedsländern, wirtschaftliche und 
soziale Prognosemodelle und weitere Daten aus Wirtschaft und Wis- 
senschaft. Auf Grundlage der großen Datenbestände berechnet eine 
„Künstliche Intelligenz“ mit Hilfe von sogenannten Machine-Learning- 
Anwendungen innerhalb weniger Stunden den optimalen Verteilungs- 
schlüssel der Ressourcen für die einzelnen Bereiche des EU-Haushalts. 

2. Im Anschluss wird das vom Rechnungshof geprüfte Modell dem Prä- 
sidenten der Europäischen Kommission sowie dem Kommissar für 
Finanzplanung und Haushalt zur Unterzeichnung vorgelegt. Somit steht 
der EU-Haushalt für das kommende Jahr fest. 


Kondition 3: Hybride Entscheidungsfindung durch KI-Systeme und EU- 
Politiker*innen 

Für die Kondition, in der die Politiker*innen den vom KI-System aufgestell- 
ten Haushaltsentwurf noch verhandelten und ggf. anpassen konnten (Kondition 
hybrider Entscheidungsfindung nachfolgend abgekürzt als kond4Y>"4), wurde 
folgender Textbaustein angeschlossen: 


Wer entscheidet über die Verwendung der Mittel? 
Die Entscheidung über den Haushalt eines jeden Jahres erfolgt in zwei 
wesentlichen Schritten: 


1. In einem ersten Verfahren führen Hochleistungscomputer des Europäi- 
schen Rechnungshofs alle auf EU-Ebene verfügbaren Daten zusam- 
men. Beispiele hierfür sind verfügbare Struktur- und Verwaltungsdaten 
aus der EU und den einzelnen Mitgliedsländern, wirtschaftliche und 
soziale Prognosemodelle und weitere Daten aus Wirtschaft und Wis- 
senschaft. Auf Grundlage der großen Datenbestände berechnet eine 
„Künstliche Intelligenz“ mit Hilfe von sogenannten Machine-Learning- 
Anwendungen innerhalb weniger Stunden den optimalen Verteilungs- 
schlüssel der Ressourcen für die einzelnen Bereiche des EU-Haushalts. 
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2. Im Anschluss wird der Haushaltsvorschlag in der Europäischen Kom- 
mission, im Europäischen Rat und im Europäischen Parlament debat- 
tiert, verhandelt und ggf. angepasst. Sobald der Vorschlag von allen 
beteiligten Institutionen angenommen wurde, steht der Haushalt des 
nachfolgenden Jahres. 


Als Abschluss fand sich in allen drei Konditionen auf der jeweiligen Stimulus- 
seite ein Diagramm, das die Aufteilung des Budgets von 160 Milliarden Euro 
2018 nach Haushaltsrubriken aufteilte (siehe Fragebogen im Anhang 3.4 im 
elektronischen Zusatzmaterial). 

Durch die Randomisierung fanden sich letztendlich n = 182 Befragte in der 
Gruppe колан, п = 204 Befragte in der Gruppe kondPM sowie n = 186 
Befragte in der Gruppe копа hr. 


Manipulationsprüfung 

Alle Befragten beantworteten zwei Fragen, die als Manipulationsprüfung dienten, 
um zu prüfen, dass die manipulierten Unterschiede zwischen den Konditionen 
auch wahrgenommen wurden. Zum einen wurde die wahrgenommene Reichweite 
der technischen Automatisierung des Entscheidungsprozesses mittels der folgen- 
den Frage bewertet: „Wie technisch automatisiert lief der Entscheidungsprozess 
ab?“ (Antwortoptionen auf der 5-stufigen Likert-Skala von 1 „überhaupt nicht 
technisch automatisiert“ zu 5 „sehr technisch automatisiert“). Die Ergebnisse zei- 
gen einen signifikanten Unterschied zwischen den Konditionen (F(2, 524) = 
389.71, p < .001). Mit Hilfe eines Games-Howell Post-Hoc-Tests zeigte sich, 
dass die Befragten die unterschiedliche Reichweite der technischen Automatisie- 
rung wahrnahmen, копаНРМ (М = 2.11; SD = .97), kondAPM (М = 4.52; SD 
= .77) und Копаћу (M = 4.16; SD = .80). 

Zum anderen wurde der Einfluss der menschlichen politischen Akteure im 
dargestellten Prozess erfragt: „Welche Rolle spielten Politiker oder politische 
Institutionen in dem Entscheidungsprozess?“ (Antwortoptionen auf der 5-stufigen 
Likert-Skala von 1 „überhaupt keine Rolle“ zu 5 „eine sehr große Rolle“). Erneut 
fanden sich signifikante Unterschiede zwischen den drei Konditionen (F(2, 548) 
= 161.98, p < .001). Mit Hilfe eines Games-Howell Post-Hoc-Tests zeigte sich, 
dass die Befragten die unterschiedliche Reichweite des menschlichen Einflusses 
der politischen Akteure und Institutionen wahrnahmen, kondHPM (M = 4.45; SD 
= .88), kondôPM (М = 2.63; SD = .99) und копању" (М = 3.41; SD = 1.04). 
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Unabhängige Variablen — die Dimensionen des BDGS 

Die BDGS-Skala ging wie üblich mit allen vier Dimensionen in den Fragebogen 
mit ein und diese wurden als unabhängige Variablen herangezogen. Am Aufbau 
und an der Aufmachung der Skala wurde im Vergleich zu den vorangegangenen 
Studien nichts geändert. 


Abhängige Variablen — Die Input-, Throughput- und Output-Legitimität 
Die drei Dimensionen der Input-, der Throughput- und der Output-Legitimität 
wurden als abhängige Variablen modelliert und wie folgt gemessen: 

Die Input-Legitimität wurde auf Grundlage relevanter Vorarbeiten (Colquitt & 
Rodell, 2015; Lindgren & Persson, 2010; Persson et al., 2013) aus dem 
Englischen adaptiert. Die Probanden gaben Auskunft zu den folgenden drei 
Frageitems: 


e Menschen wie ich konnten den Entscheidungsprozess beeinflussen. (/tem- 
ID ПА, Referenzindikator) 

e Menschen wie ich konnten im Entscheidungsprozess ihre Meinung äußern. 
(Item-ID IL2) 

e Alle BürgerInnen hatten die Möglichkeit am Entscheidungsprozess teilzuneh- 
men. (Item-ID IL3) 


Diese Fragen wurden auf einer 5-stufigen Likert-Skala erhoben, bei der die 
Extrema mit „stimme nicht zu“ (zugewiesener Wert 1) und „stimme zu“ (zuge- 
wiesener Wert 5) beschriftet waren. Zudem gab es die Möglichkeit einer „weiß 
nicht“-Option. Die drei Items hatten eine hohe interne Konsistenz (a = .772; 
DEV = .542). Bis auf Item 2 zeigen sich bei der Modellierung eines laten- 
ten Faktors, der auf die drei Indikatoren lädt, ausreichend hohe Faktorladungen 
Олы = .706, X2 = .642, Ans = .846).!? Trotzdem wird Item /L2 mit in die 
Datenanalyse aufgenommen, da die Faktorladung zwar etwas gering ausfällt, der 
Indikator dennoch ausreichend Information bereitstellt. 

Die Throughput-Legitimität wurde auf Grundlage von Werner und Marien 
(2018) aus dem Englischen adaptiert und angepasst. Die Probanden bewerteten 
die Eigenschaften des Entscheidungsprozesses wie folgt: 

Der beschriebene Entscheidungsprozess war ... 


e fair. (Пет ID ТЇН, Referenzindikator) 


12 Da ein Messmodell mit einem auf die drei Indikatoren ladenden latenten Faktor vollstän- 
dig identifiziert ist, wird keine Anpassungsgüte berichtet. 
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e zufriedenstellend. (Пет ID TL2) 
e angemessen. (Пет ID ТЕЗ) 


Diese Fragen wurden auf einer 5-stufigen Likert-Skala erhoben, bei der die 
Extrema mit „stimme nicht zu“ (zugewiesener Wert 1) und „stimme zu“ (zuge- 
wiesener Wert 5) beschriftet waren. Zudem gab es die Möglichkeit einer „weiß 
nicht“-Option. Die drei Items hatten eine hohe interne Konsistenz (a = .881; 
DEV = .715). Bei der Modellierung eines latenten Faktors, der auf die drei Indi- 
katoren lädt, zeigten sich ausreichend hohe Faktorladungen (Ont = .822, ATL2 
= .833, из = .880).13 

Mit Blick auf die Output-Legitimität unterscheidet die Literatur zum einen, 
inwieweit die vorgegebenen Ziele von politischen Entscheidungen erreicht wer- 
den (Lindgren & Persson, 2010) und ob die Entscheidungen von den Bür- 
ger*innen auch begrüßt und für vorteilhaft befunden werden (Esaiasson et al., 
2012; Werner & Marien, 2018), wobei ein Zusammenhang zwischen beiden 
Elementen bestehen kann, aber nicht bestehen muss. Daher wird bei der Mes- 
sung von Output-Legitimität zwischen der bewerteten Zielerreichung und der 
Akzeptanz der Entscheidung unterschieden. 


Für die Zielerreichung wurden die Probanden gefragt, inwieweit die getroffe- 
nen Entscheidungen in den jeweiligen Konditionen dazu geeignet waren, die 
im Stimulustext hervorgehobenen Ziele zu erreichen. Die Frage wurde wie folgt 
eingeleitet: 


„Nun geht es um Ihre persönliche Einschätzung, ob der Entscheidungsprozess, den 
Sie gerade gelesen haben, dazu geeignet ist, die übergeordneten Ziele der EU zu 
erreichen. Inwiefern stimmen Sie den folgenden Aussagen zu?“ 


Der beschriebene Entscheidungsprozess führt zu ... 


e einem Ausbau der Verkehrswege, Energienetze und Kommunikationsverbin- 
dungen zwischen den EU-Ländern. (Пет ID ZEI) 
einem verbesserten Schutz der Umwelt in ganz Europa. (Пет ID ZE2) 

e einer Erhöhung der weltweiten Wettbewerbsfähigkeit der europäischen Wirt- 
schaft. (Item ID ZE3) 

e einer Förderung grenzüberschreitender Zusammenschlüsse europäischer Wis- 
senschaftler und Forscher. (Item ID ZE4) 


13 Da auch hier ein Messmodell mit einem auf die drei Indikatoren ladenden latenten Faktor 
vollständig identifiziert ist, wird keine Anpassungsgüte berichtet. 
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Diese Fragen wurden auf einer 5-stufigen Likert-Skala erhoben, bei der die 
Extrema mit „stimme nicht zu“ (zugewiesener Wert 1) und „stimme zu“ (zuge- 
wiesener Wert 5) beschriftet waren. Zudem gab es die Möglichkeit einer „weiß 
nicht“-Option. Die vier Indikatoren hatten zwar eine hohe interne Konsistenz (a 
= .834). Da die vier Items jedoch auch unabhängig voneinander erreicht wer- 
den können und streng genommen kein reflektives uni-dimensionales Konstrukt 
abbildeten, wurde für die Analyse der Variablen ein Mittelwert-Index gebildet. 

Die Akzeptanz der Entscheidung wurde auf Grundlage von Werner und Marien 
(2018) aus dem Englischen adaptiert und erweitert.!'* Die Frage wurde wie folgt 
eingeleitet: 


„Im Folgenden interessiert uns Ihre persönliche Meinung zum Ergebnis des Ent- 
scheidungsprozesses, über den Sie gerade gelesen haben. Inwiefern stimmen Sie den 
Aussagen zu?“ 


Ich akzeptiere die Entscheidung. (Item ID О) 
Ich bin mit der Entscheidung einverstanden. (Пет ID OL2, Referenzindika- 
tor)!> 


e Die Entscheidung stellt mich zufrieden. (Пет ID OL3) 


Diese Fragen wurden auf einer 5-stufigen Likert-Skala erhoben, bei der die 
Extrema mit ,,stimme nicht zu“ (zugewiesener Wert 1) und ,,stimme zu“ (zuge- 
wiesener Wert 5) beschriftet waren. Zudem gab es die Möglichkeit einer „weiß 
nicht“-Option. Die drei Items hatten eine hohe interne Konsistenz (a = .875; 
DEV = .726). Bei der Modellierung eines latenten Faktors, der auf die drei Indi- 
katoren lädt, zeigen sich ausreichend hohe Faktorladungen (огл = .678, XoL2 
= .993, моз = .856).16 


Prüfung der Messäquivalenz 

Im vorliegenden Fall muss aufgrund der separaten Messung der Variablen 
in den drei Experimentalgruppen zunächst im Rahmen einer Mehrgruppen- 
Kausalanalyse (MGKA) die Messäquivalenz geprüft werden. Die MGKA erlaubt 


14 Die Messung von Werner und Marien (2018) beinhaltet neben den Items OL1 und OL2 
noch zwei Indikatoren, die Reaktanz indizieren. Diese wurden nicht aufgenommen und Item 
OL3 wurde selbst formuliert und ergänzt. 

15 Item OL2 dient hier als Referenzindikator, da bei der nachfolgenden Prüfung auf Messä- 
quivalenz festgestellt wurde, dass Item OL1 nicht messinvariant ist. 

16 Da auch hier ein Messmodell mit einem auf die drei Indikatoren ladenden latenten Faktor 
vollständig identifiziert ist, wird keine Anpassungsgüte berichtet. 
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die „die simultane Schätzung eines Kausalmodells über mehrere Gruppen hin- 
weg“ (Weiber & Mühlhaus, 2014, $. 287, Hervorh. im Orig.). Für die Dimensio- 
nen des BDGS wird dies nachfolgend in Abschnitt 10.7 geprüft. An dieser Stelle 
soll daher lediglich auf die Prüfung der Messäquivalenz der als latente Faktoren 
abgebildeten Legitimitäts-Dimensionen eingegangen werden (siehe Tabelle 2.D 
im Anhang im elektronischen Zusatzmaterial). 

Hier zeigt die Prüfung der Messäquivalenz, dass die Voraussetzung der 
metrischen und skalaren Invarianz verletzt ist. Die Prüfung der Indikatoren 
offenbart, dass Item IL02 und OL1 nicht messinvariant sind. Daher wurden Iden- 
titätsrestriktionen für das Regressionsgewicht und die Regressionskonstante des 
Indikators freigegeben. Ein Chi-Quadrat-Differenztest zwischen dem unrestrin- 
gierten Modell М1 und dem Modell mit partieller Messäquivalenz M4 zeigt, dass 
die Restriktionen nicht signifikant zu einer Verschlechterung der Anpassungsgüte 
führen (AX? = 21.715, Adf = 16; p = .153). Mithin besteht für die Messung der 
Input-Legitimität sowie der Output-Legitimität lediglich partielle Messinvarianz, 
was in den nachfolgend geprüften Modellen berücksichtigt wird. 


10.6.2 Erhebung 2.2 КІ-Веагоһипд 


Unabhängige Variablen — die Dimensionen des BDGS 
Die BDGS-Skala wurde in unveränderter Form in den Fragebogen aufgenommen. 


Abhängige Variablen — Operationalisierung des Konstruktes der Bedrohungswahr- 
nehmung durch KI 

Da die Messung der Bedrohungswahrnehmung durch KI zwar standardisiert 
durchgeführt werden sollte, allerdings an den jeweiligen Untersuchungskontext 
angepasst werden musste, wurde die Ausarbeitung teil-standardisiert und mit 
Platzhaltern gearbeitet (Kieslich et al., 2021). 

Zunächst sollte wie auch bei der BDGS-Skala ein Grundverständnis für KI 
und deren Einsatzmöglichkeiten hergestellt werden. Daher bekamen die Befragten 
zunächst einen Einführungstext ins Thema in Form einer Vignette zu lesen. Die 
Vignette lautete wie folgt: 


Derzeit wird in der Öffentlichkeit viel über ‚Künstliche Intelligenz‘ (КЇ) 
gesprochen. Gemeint sind hier Computeranwendungen, die automatisiert 
digitale Daten auswerten. Diese Auswertung großer Datenmengen stellt 
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für eine KI einen Lernprozess dar, aus dem sie laufend neue Informa- 
tionen verarbeitet und so im Zeitverlauf immer präzisere Muster erkennt. 
Auf Grundlage dieser Analyse können Sachverhalte festgestellt sowie 
zukünftige Entwicklungen prognostiziert werden. Resultierend kann eine 
KI dem Menschen Handlungsempfehlungen vorschlagen oder autonom 
Entscheidungen treffen und diese zum Teil auch direkt ausführen. 


Da die Studie zur Skalenkonstruktion unterschiedliche Anwendungsgebiete von 
KI in den Blick nehmen sollte, wurde die Vignette nach der allgemeinen Erklä- 
rung von KI auf die drei Anwendungsbereiche (a) Krankheitserkennung und 
-Therapie (Medizin), (b) Recruiting im Personalwesen und (c) Kreditzuteilung 
im Bankensektor zugeschnitten. Der anschließende Text, der direkt unter dem 
ersten Textteil der Vignette zu finden war, las sich in den drei Bereichen wie 
folgt: 


Medizin 

Auch im medizinischen Bereich ist der Einsatz von КТ auf dem Vormarsch. 
KI-basierte Anwendungen werden inzwischen zur automatisierten Erken- 
nung von Krankheiten genutzt — so können KI-Systeme bspw. Erb- und 
Stoffwechselkrankheiten oder Krebs identifizieren. Die KI kann auf dieser 
Datengrundlage eigenständig Therapiemaßnahmen ausarbeiten. 


Personalwesen 

Im Personalwesen ist der Einsatz von KI auf dem Vormarsch. KI-basierte 
Anwendungen werden inzwischen zur automatisierten Erkennung der Eig- 
nung von Bewerber*innen auf einen Arbeitsplatz eingesetzt — so können 
KI-Systeme die Arbeitsleistung der Bewerber*innen vorhersagen. Die 
KI kann auf dieser Datengrundlage geeignete Stellenbewerber*innen von 
ungeeigneten Bewerber*innen unterscheiden. 


Bankensektor 

Im Bankensektor ist der Einsatz von KI auf dem Vormarsch. KI- 
basierte Anwendungen werden inzwischen zur automatisierten Erkennung 
der Kreditwiirdigkeit von Antragsteller*innen genutzt — so können KI- 
Systeme bspw. die Ausfallwahrscheinlichkeit von Krediten vorhersagen. 
Die KI kann auf dieser Datengrundlage eigenständig Entscheidungen über 
Annahme oder Ablehnung von Kreditanträgen ausarbeiten. 
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Im direkten Anschluss zum Text der Vignette wurden die vier zuvor genannten 
Funktionen der KI unterschieden und es fanden sich für jede der Funktionen drei 
Frageitems als Indikatoren. In Tabelle 10.1 findet sich die Formulierung der Items 
samt den Platzhaltern für den jeweiligen Anwendungsbereich. 


Tabelle 10.1 Aufbau und Indikatorformulierungen der Bedrohungswahrnehmung von КЇ 
mit Platzhaltern — Erhebung 2.2 KI-Bedrohung 


Item Dimension 

Wenn Sie nun an den Einsatz von Recognition — Erkennung/Identifikation 
КТ im Bereich [OBJEKT] erkennen. 
[ANWENDUNGSBEREICH] 

denken, für wie bedrohlich halten [OBJEKT] erfassen. 


Sie Computersysteme mit [OBJEKT] identifizieren. 
Künstlicher Intelligenz, die... 


Prediction — Vorhersage 


Entwicklungen von [OBJEKT] vorhersagen. 


die Entwicklung von [OBJEKT] prognostizieren. 
die Entwicklung von [OBJEKT] berechnet. 
Recommendation — Entscheidungsempfehlung 
[HANDLUNG] empfehlen. 
[HANDLUNG] vorschlagen. 
[HANDLUNG] nahelegen. 
Decision-Making — Entscheidung 
über [HANDLUNG] entscheiden. 
[HANDLUNG] festlegen. 
[HANDLUNG] vorgeben. 


Für den Einsatz von KI-Systemen im medizinischen Bereich wurde folg- 
lich für die Erkennung das Objekt ‚Krankheit‘ eingefügt, die ‚Entwicklung von 
Krankheiten‘ vorhergesagt und eine ‚medizinische Behandlung‘ empfohlen oder 
bereits entschieden und festgelegt. 

Für den Einsatz von KI-Systemen im Personalwesen wurde die Bewer- 
bungssituation auf einen Arbeitsplatz als Beispiel gewählt. Folglich wurde 
für die Erkennung das Objekt ‚Eignung von Bewerber*innen‘ eingefügt, die 
‚Arbeitsleistung von Bewerber*innen‘ vorhergesagt und eine ‚Einstellung von 
Bewerber*innen‘ empfohlen oder bereits entschieden und festgelegt. 

Für den Einsatz von KI-Systemen im Bankensektor wurde die KI-basierte Ver- 
gabe von Krediten durch Bankinstitute als Beispiel gewählt. Folglich wurde für 
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die Erkennung das Objekt ‚Kreditwürdigkeit von Kunden‘ eingefügt, die ‚Aus- 
fallwahrscheinlichkeit von Krediten‘ vorhergesagt und eine ‚Entscheidung über 
die Kreditvergabe‘ empfohlen oder die ‚Kreditvergabe‘ bereits direkt entschie- 
den und festgelegt. Der finale Fragebogen mit der Umsetzung der Vorlage und 
des Zuschnitts auf den jeweiligen Anwendungsbereich findet sich in Anhang 3.5 
im elektronischen Zusatzmaterial. Für die nachfolgende Analyse wurde, wie in 
Abschnitt 10.3.2 diskutiert, lediglich auf die letztgenannten Dimensionen der Ent- 
scheidungsempfehlung und der tatsächlichen Entscheidung durch die KI-Systeme 
abgestellt. 


10.6.3 Erhebung 2.3 Krankenversicherung 


Unabhängige Variablen — die Manipulation des zu erwartenden Profits und der 
Notwendigkeit der Datenabgabe 

Als Ergebnis der vorgeblichen Berechnung eines individualisierten Tarifs wurde 
nach der zehn Sekunden langen simulierten Berechnung randomisiert eine Seite 
ausgespielt, die das jeweilige experimentelle Treatment enthielt. 

Zum einen wurde der zu erwartende finanzielle Vorteil variiert, der nachfol- 
gend als der individuelle Profit bezeichnet wird. Entweder wurde den Befragten 
mitgeteilt, dass auf Grundlage ihrer Angaben eine Ersparnis von 19,74 % (Fak- 
torstufe ‚Profit‘) möglich sei, oder 1,03 % (Faktorstufe ‚Kein Profit‘).!7 Die 
Nennung der Prozentzahl erfolgt einmal prominent in einem Kasten mittig auf 
der Fragebogenseite und einmal im nebenstehenden Erläuterungstext. Zudem 
wurde den Befragten in einer entsprechenden Beispielrechnung anhand eines 
durchschnittlichen Brutto-Einkommens von 2500 € konkret genannt, wie viel 
Euro im Monat bei Wahl des Versicherungstarifs gespart werden könnten. In der 
Kondition ‚Kein Profit‘ waren dies monatlich 1,88 € und jährlich entsprechend 
22,56 €. In der Kondition ‚Profit‘ waren dies monatlich 36,03 € und jährlich 
entsprechend 432,36 €. 

Des Weiteren wurde die Notwendigkeit der Datenabgabe für die Inanspruch- 
nahme des jeweiligen Tarifs manipuliert. In der Kondition ‚Ohne Datenabgabe‘ 
bekamen die Befragten lediglich den Hinweis auf die jeweilige Ersparnis und es 


17 Streng genommen handelt es sich bei einer möglichen Ersparnis von 1,03 % der Kranken- 
versicherung um einen geringen Profit, der jedoch nicht als substantiell gewertet wird und 
lediglich aus dem Grund gewählt wurde, dass bei den Befragten ein möglichst realistisches 
Bild einer punktgenauen Schätzung auf Datengrundlage evoziert werden sollte. Mit Blick 
auf die Rational-Choice-Logik sowie die lineare Auswertungslogik kann davon ausgegan- 
gen werden, dass letztendlich Einfluss und Bewertung eines beliebigen prozentualen Profits 
berechnet werden könnten. Diese Annahme konnte jedoch aus forschungsökonomischen 
Gründen im vorliegenden Experiment nicht empirisch geprüft werden. 
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wurde der Wunsch ausgesprochen, die Befragten bald als Mitglieder der Kranken- 
versicherung begrüßen zu dürfen. In der Kondition ‚Mit Datenabgabe‘ wurde den 
Befragten zusätzlich zum Hinweis auf die Ersparnis folgender Text präsentiert: 


Ihre Daten - Ihre Gesundheit 

Diese innovative Versicherung kann nur erfolgreich funktionieren, wenn 
wir als Krankenversicherung auf eine breite Datengrundlage unserer Versi- 
cherungsnehmer zugreifen können. Die Datenübermittlung erfolgt mit Ihrer 
Einverständniserklärung kostenfrei und automatisch. 

Die dadurch erhobenen Daten werden ausschließlich zur zukünftigen 
Berechnung Ihres individuellen Beitrages benutzt. Die INDIVIDUA erfüllt 
hierbei alle gesetzlichen Bestimmungen zum Datenschutz gemäß Europäi- 
schen Datenschutzgrundverordnung (DSGVO). Durch Ihre Zustimmung zur 
Datenerfassung gehen Sie mit uns den entscheidenden Schritt in Richtung 
Zukunft. 


Die jeweiligen Faktorstufen wurden mit 0 (‚Kein Profit‘ und ‚Keine Datenab- 
gabe‘) oder 1 (,Profit‘ und ‚Datenabgabe‘) in zwei entsprechenden Variablen im 
Datensatz dummy-codiert. 


Manipulationsprüfung 

Es wurde eine Manipulationsprüfung durchgeführt, um zu prüfen, ob das Stimu- 
lusmaterial von den Befragten wahrgenommen und der Inhalt verstanden wurde. 
Wird bspw. der Nutzen variiert, sollte für Personen in der Kondition mit hohem 
Nutzen die Nutzenwahrnehmung auch entsprechend höher ausfallen als in der 
Kondition mit geringfügigem Nutzen. Allerdings ist hiermit noch nicht verifi- 
ziert, dass es tatsächlich zu einer Variation auf Seiten der unabhängigen Variable 
gekommen ist. Es ist lediglich die Voraussetzung geprüft, dass im Falle des Aus- 
bleibens dieser beobachteten Variation zumindest ausgeschlossen werden kann, 
dass dies nicht an einer schwachen oder unverständlichen Manipulation liegt. 
Hierzu beantworteten die Befragten nach der Manipulation Fragen bezüglich 
des jeweils präsentierten Stimulusmaterials. Zum einen sollten die Probanden 
also den individuellen Nutzen bewerten („Ich würde finanziell stark von dem für 


ce) 18 
). 


mich berechneten individualisierten Tarif profitieren Zum anderen wurde die 


18 Alle Items der Manipulationsprüfung wurden auf einer 5-stufigen Likert-Skala erhoben, 
die wie folgt abgestuft war: 1 „trifft überhaupt nicht zu“, 2 „trifft eher nicht zu“, 3 „trifft 
teils zu, teils nicht zu“, 4 „trifft eher zu“ sowie 5 „trifft voll und ganz zu“. Es gab zudem eine 
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Notwendigkeit der Datenabgabe erfragt („Ich wurde im Text explizit darauf hin- 
gewiesen, dass ich in Zukunft meine persönlichen Daten abgeben miisste“).!? In 
Teilerhebung 2.3a Krankenversicherung nahmen die Befragten, denen ein hoher 
Nutzen ausgegeben wurde, diesen auch eher wahr (М = 3.53, SD = 1.03, п = 
72) als die Befragten, denen eine geringfügiger Nutzen angezeigt wurde (M = 
2.44, SD = 1.03, п = 77; t(147) = -6.372; р < .001). Auch in Teilerhebung 
2.3b Krankenversicherung war die Manipulation erfolgreich. Hier nahmen die 
Befragten, denen ein hoher Nutzen ausgegeben wurde, diesen auch eher wahr (M 
= 3.16, SD = 1.26, n = 203) als die Befragten, denen ein geringfügiger Nut- 
zen angezeigt wurde (М = 1.98, SD = 1.12, п = 205; r(406) = -9.956; р < 
.001). Für die Notwendigkeit der Datenabgabe zeigte sich, dass in Teilerhebung 
2.3a Krankenversicherung die Befragten, denen in Verbindung mit dem Tarifan- 
gebot explizit die Datenabgabe auferlegt wurde, diese Notwendigkeit auch eher 
wahrgenommen haben (M = 3.22, SD = 1.30, n = 64) als die Befragten, die 
hierzu nicht explizit aufgefordert wurden (M = 2.88, SD = 1.31, n = 68). Aller- 
dings ist dieser Unterschied hier statistisch nicht signifikant, 130) = -1.478; 
р = .142. Um auszuschließen, dass dieser Umstand durch die Frageformulie- 
rung begründet ist, wurde diese noch einmal konkretisiert.71 In Teilerhebung 
2.3b Krankenversicherung wurde die Notwendigkeit letztlich von den Befragten, 
die hierzu aufgefordert waren, eher wahrgenommen (M = 3.55, SD = 1.57,n = 
183) als von den Befragten, die hierzu nicht explizit aufgefordert wurden (M = 
2.31, SD = 1.49, п = 177). Der Unterschied ist signifikant, 1(438) = -7.692; р 
< .001). 


Unabhängige Variablen — die Dimensionen des BDGS 
Zusätzlich zu den Manipulationen wurde die BDGS-Skala in unveränderter Form 
in den Fragebogen aufgenommen. 


Option „weiß nicht“, um einen Abbruch oder den Skalenmittelpunkt als Ausweichkategorie 
zu vermeiden. Um einen Bias zu vermeiden, wurden die entsprechenden Befragten nicht aus 
der Stichprobe entfernt (Aronow et al., 2019). 

19 Aufgrund des nicht signifikanten Ergebnisses der Manipulationsprüfung wurde diese 
Frage in Erhebung 2.3b noch einmal spezifiziert und lautete hier „Ich wurde bei der Berech- 
nung meines individualisierten Versicherungstarifs explizit darauf hingewiesen, dass ich in 
Zukunft meine persönlichen Daten abgeben müsste“. Eine Veränderung des Stimulusmate- 
rials selbst erfolgte jedoch nicht. 
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Abhängige Variable — die Bereitschaft zum Wechsel in eine digitale individualisierte 
Krankenversicherung 

Mittels der folgenden Frage wurde die Bereitschaft zum Wechsel in die vor- 
gestellte individualisierte Krankenversicherung erhoben: „Wären Sie bereit, auf 
Grundlage des gezeigten Angebots und seiner Konditionen, zur INDIVIDUA- 
Krankenversicherung zu wechseln?“ Die Antwort erfolgte auf einer 5-stufigen 
Antwortskala, die wie folgt codiert wurde: 1 — „Ja, auf jeden Fall“, 2 – „Eher 
ja“, 3 – „Unentschieden“, 4 — „Eher nein“, sowie 5 — „Nein, auf keinen Fall“. 
Für die Datenauswertung wurde die Variable anschließend invertiert, so dass hohe 
Werte eine hohe Wechselbereitschaft bedeuten (Erhebung 2.3a: М = 2.26, SD = 
1.05; Erhebung 2.3b: M = 1.61, SD = .87). 


10.6.4 Erhebung 2.4 KI und Hochschule 


Unabhängige Variablen — die Dimensionen des BDGS 
Die BDGS-Skala wurde in unveränderter Form in den Fragebogen aufgenommen. 


Abhängige Variablen — Vertrauen in die Richtigkeit der KI-basierten Entscheidung, 
Reputation der Hochschule und Protest gegen die Auswahlentscheidung 

Die Variable Vertrauen in die Richtigkeit der KI-basierten Entscheidung wurde 
ausgehend von der Arbeit von Lee (2018) übersetzt und mittels der folgenden 
Single-Item-Frage erhoben: ‚Wie sehr vertrauen Sie darauf, dass ein KI-basiertes 
Zulassungsverfahren die richtige Entscheidung trifft?‘. Die Skalierung war 7-stufig 
und die Extrema der Skala waren mit ‚überhaupt kein Vertrauen‘ (zugewiesener 
Wert 1) und ‚vollstes Vertrauen‘ (zugewiesener Wert 7) beschriftet. Der Mittelwert 
des Items lag bei 4.09 (SD = 1.50). 

Die abhängige Variable zur wahrgenommenen Reputation der Hochschule 
wurde auf Grundlage einer Studie zur Reputation von Unternehmen von Ponzi 
et al. (2011) aus dem Englischen übersetzt. Die auf dieser RepTrak™-Skala 
basierende Itembatterie wurde mit folgendem Fragetext eingeleitet: 


Bitte stellen Sie sich vor, die Universität, an der Sie sich um einen Studienplatz bewer- 
ben, setzt ein Computersystem mit Künstlicher Intelligenz ein, um über die Zulassung 
zu entscheiden. Inwieweit stimmen Sie den folgenden Aussagen zu oder stimmen ihnen 
nicht zu? 
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Daraufhin beantworteten die Probanden die folgenden vier Frageitems: 


e Es ist eine Universität, bei der ich ein gutes Gefühl habe. (Item-ID Repl, 
Referenzindikator) 

e Es ist eine Universität, der ich vertrauen kann. (Item-ID Rep2) 

e Es ist eine Universität, die ich bewundere und respektiere. (Item-ID Ren?) 

e Die Universität hat insgesamt einen guten Ruf. (Item ID-Rep4) 


Diese Fragen wurden auf einer 5-stufigen Likert-Skala erhoben, bei der die 
Extrema mit ‚stimme überhaupt nicht zu‘ (zugewiesener Wert 1) und „stimme 
voll und ganz zu‘ (zugewiesener Wert 5) beschriftet waren. Die vier Items hatte 
eine hohe interne Konsistenz (а = .872; DEV = .636). Eine CFA, bei der ein 
latenter Faktor auf die vier Items lud, zeigte eine hohe Anpassungsgüte (X?(12) 
= 5.047, р = .08; RMSEA = .071 [.000, .151]; TLI = .985). Bis auf Item Rep4 
zeigen sich ausreichend hohe Faktorladungen (pen) = .862, ARep2 = .858, ARep3 
= .783, \Rep4 = .671). Trotzdem wird Item Rep4 mit in die Datenanalyse aufge- 
nommen, da die Faktorladung zwar etwas gering ausfallt, der Indikator dennoch 
zusätzliche Information bereitstellt. 

Zudem wurde erhoben, inwieweit die Befragten bereit wären, gegen die von 
der KI getroffene Auswahlentscheidung zu protestieren. Die abhängige Variable 
Protest gegen die KI-basierte Auswahlentscheidung wird dabei als Handlungsin- 
tention im Sinne politischer Mitsprache betrachtet. Ähnlich dem Konzept Political 
Voice, das in der politikwissenschaftlichen Literatur als eine Kategorie von Hand- 
lungsmacht begriffen wird (Hirschman, 1970), zielt das Konstrukt darauf ab, 
inwieweit eine aktive Missbilligung durch die Probanden geäußert wird. Hierfür 
wurden die folgenden vier Fragen eigenständig formuliert: 


e Ich würde mich aktiv gegen das Auswahlverfahren einsetzen. (Item-ID Protl; 
Referenzindikator) 

• An einer Demonstration gegen das Auswahlverfahren würde ich teilnehmen. 
(Item-ID Prot2) 

® Ich würde eine Petition gegen das Auswahlverfahren unterschreiben. (Item-ID 
Prot3) 

e Ich würde einen Protest gegen das Auswahlverfahren unterstützen. (Item-ID 
Prot4) 


Diese Fragen wurden ebenfalls auf einer 5-stufigen Likert-Skala erhoben, bei der 
die Extrema mit ‚stimme überhaupt nicht zu‘ (zugewiesener Wert 1) und ‚stimme 
voll und ganz zu‘ (zugewiesener Wert 5) beschriftet waren und es die Option gab 
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mit ‚weiß nicht‘ zu antworten. Die vier Items hatte eine hohe interne Konsistenz 
(a = .915; DEV = .717). Eine CFA, bei der ein latenter Faktor auf die vier Items 
lud, zeigte eine hohe Anpassungsgüte (X?(12) = 2.420, p = .298; RMSEA = 
.026 [.000, .120]; TLI = .997). Für alle vier Items zeigen sich ausreichend hohe 
Faktorladungen (Aprott = -816, Ap? = .879, ргыз = 781, Хрюм = .906). 


10.7 Datenauswertung für das 
‚Big-Data-Glaubenssystem’ in den Erhebungen 2.1 
bis 2.4 


Für jede Erhebung in Studie 2 wurde im Rahmen einer CFA ein Modell spe- 
zifiziert und geprüft, bei der die jeweils drei Indikatoren jeder Dimension auf 
einen latenten Faktor laden. Dabei werden die beiden Teilerhebungen 2.3a und 
2.3b getrennt betrachtet. Für Erhebung 2.1 EU und KI und 2.4 wurde jeweils ein 
Modell spezifiziert und geprüft. 

In Erhebung 2.1 EU und KI wurde die BDGS-Skala dabei vor der randomisier- 
ten Zuweisung zu den Experimentalkonditionen und somit vor der Manipulation 
beantwortet. Es sind daher mit Blick auf die Ausprägung des BDGS bei den 
Befragten zum einen keine systematischen Unterschiede zwischen den Grup- 
pen und zum anderen keine Ausstrahlungs- und Befragungseffekte durch den 
Fragebogenaufbau zu erwarten und auch nicht zu beobachten " In Erhebung 
2.2 KI-Bedrohung wurde das Modell für drei Gruppen der unterschiedlichen 
Anwendungskontexte spezifiziert (siehe Abschnitt 10.6.2). Da die Bedrohungs- 
wahrnehmung durch KI in den einzelnen Anwendungsbereichen im Fragebogen 
vor der Erhebung der BDGS-Skala erfragt wurde, ist neben der allgemeinen 
Modellspezifikation auch wie für Erhebung 2.3 Krankenversicherung auf Messä- 
quivalenz zwischen den einzelnen Gruppen zu prüfen, um einen Befragungseffekt 
auf die BDGS-Skala auszuschließen. Da es anders als in Erhebung 2.3 jedoch 
nicht um eine identische Befragung mit einer anderen Stichprobe ging, sondern 
nachfolgend ja insbesondere Unterschiede der Pfadkoeffizienten zwischen BDGS 
und KI-Bedrohungswahrnehmung geprüft werden sollen, beschränkt sich die Prü- 
fung der Messäquivalenz nur auf die BDGS-Skala. Es wird mithin getestet, ob 
die vermutete Beziehungsstruktur des BDGS in beiden Stichproben äquivalent 


20 Eine Prüfung auf Messinvarianz der BDGS-Skala zwischen den Experimentalgruppen 
mittels MGKA zeigt, dass bis auf die Messinvarianz der Messfehler Messäquivalenz zwi- 
schen den Gruppen bestand. Das Modell mit Gleichheitsrestriktionen für Regressionsge- 
wichte, -konstanten und die Kovarianzen zeigt keine signifikant schlechtere Anpassung als 
das Modell ohne diese Identitätsrestriktionen (AX? = 60.116, df = 60, p= 472). 
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ist. Die zu prüfenden Modelle wurden gemäß der Konfiguration in Abbildung 2 
spezifiziert und mit den entsprechenden Gleichheitsrestriktionen für die jeweilige 
Stufe der Messinvarianz versehen (Weiber & Mühlhaus, 2014). Der Modellver- 
gleich der geschätzten Modelle in Tabelle 10.2 zeigt, dass nachfolgend lediglich 
die Voraussetzungen der Messfehlervarianz (auch strikte faktorielle Messinvarianz 
genannt) nicht erfüllt sind. 

Die Werte für die Anpassungsgüte der Modelle finden sich in Tabelle 10.3. 
Mit Blick auf den strengen Chi-Quadrat-Test zeigt sich für die Erhebungen 2.1, 
2.2, 2.3a und 2.4 eine unzureichende Anpassungsgüte. Nur in Teilerhebung 2.3b 
Krankenversicherung ist diese zufriedenstellend. Auch aufgrund der Fallzahlen 
kommt es in den einzelnen Erhebungen zu geteilter Varianz der einzelnen BDGS- 
Indikatoren, die jedoch über alle Erhebungen hinweg keiner Systematik folgen. 
Die inkrementellen Fit-Maße indizieren insgesamt jedoch eine ausreichende (Tei- 
lerhebung 2.3a Krankenversicherung) bis zufriedenstellende Passung des jeweils 
spezifizierten Modells. 

In Tabelle 10.4 finden sich die jeweiligen Angaben zum Cronbachschen « 
und der DEV der jeweiligen Dimensionen in den einzelnen Erhebungen. Die 
jeweiligen Werte indizieren für das Modell in den Erhebungen über alle vier 
Dimensionen hinweg eine hohe interne Konsistenz der Indikatoren. 

Darüber hinaus finden sich in Tabelle 10.5, Tabelle 10.6, Tabelle 10.7 und 
Tabelle 10.8 die geschätzten Regressionskonstanten und -gewichte sowie die 
Faktorladungen der einzelnen Indikatoren samt deren Dimensionszugehörigkeit 
innerhalb des BDGS. Um zu prüfen, ob sich die Werte der Regressionskonstan- 
ten signifikant vom Skalenmittelpunkt unterscheiden, wurde in allen Modellen 
zusätzlich ein Bootstrapping in AMOS für ,Bias-corrected confidence intervals‘ 
nach (Efron, 1987) mit insgesamt 500 Stichproben durchgefiihrt. 

Die Faktorladungen sind in allen Modellen weitgehend als gut zu bewerten. 
Es zeigt sich mit Blick auf Erhebung 2.1 EU und KI, dass die Faktorladung 
von Item W2 (,,Digitale Daten fiihren zu neuen Fakten“) mit einem Wert von 
(1.2.1 м2 = .667) als nicht zufriedenstellend gewertet wird. Auch in den drei 
Anwendungskontexten der Erhebung 2.2 KI-Bedrohung (№2 w2_Medizin = .661, 
2.2 _W2_Personalwesen = .658, 2.2_W2_Bankensektor = .643), in Erhebung 2.3b Kran- 
kenversicherung (h2,3b_w2 = .606) sowie in Erhebung 2.4 KI und Hochschule 
(X24_w2 = .627) weist W2 erneut eine eher unzureichende Faktorladung auf. 
Lediglich in Erhebung 2.3a Krankenversicherung hat das gleiche Item mit einem 
Wert von 2.32. w2 = .704 eine gerade noch zufriedenstellende Faktorladung. 
Dies ist als weiteres Indiz für die problematische Formulierung zu werten, die 
auf ‚neue Fakten‘ abstellt, die aus den Daten gewonnen werden können (siehe 
Abschnitt 9.3.1). 
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Tabelle 10.5 Kennwerte Dimensionen und Indikatoren — Erhebung 2.1 EU und КЇ: Modell 
BDGS 


Item-ID | Itemformulierung „Digitale В (SE) 95% CI[LL; UL] |ß(SE) A 
Daten ...“ 
Genauigkeit 
СЕТ ... ermöglichen ein genaues 3.883 (.061) | [3.762; 3.997] 1è .858 


Verständnis der Welt. 


GE2 ... ermöglichen ein exaktes 3.542 (.061) | [3.410; 3.661] .948*** (.043) | .810 
Verständnis der Welt. 


GE3 ... ermöglichen ein objektives | 3.577 (.062) [3.441; 3.697] .912*** (.047) 767 
Verständnis der Wirklichkeit. 


Wissensgewinn 

WI ... verhelfen zu neuem Wissen. | 5.061 (.057) [4.946; 5.177] i 871 
WI ... führen zu neuen Fakten. 4.638 (.063) | [4.521; 4.759] .852*** (051) | .667 
w3 ... verhelfen zu neuen 5.063 (.054) | [4.952; 5.170] .884*** (042) |.802 

Erkenntnissen. 

Individueller Nutzen 

INI ... erzeugen für mich 3.612 (.064) 3.488; 3.758] 12 875 

persönlich einen Mehrwert. 
IN2 ... führen für mich zu Vorteilen. | 3.759 (.060) 3.630; 3.874] .917*** (033) |.865 
IN3 ... haben für mich persönlich 3.701 (.061) 3.577; 3.826] .947*** (.034) |.877 


positive Auswirkungen. 


Gesellschaftlicher Nutzen 


GNI ... erzeugen einen Mehrwert 3.976 (.058) 3.824; 4.086] 13 .895 
für die Gesellschaft. 

GN2 ... führen zu gesellschaftlichen | 3.778 (.057) 3.661; 3.899] .918*** (.033) |.847 
Vorteilen. 

GN3 ... sind ein gesellschaftlicher 3.850 (.059) 3.703; 3.962] .985*** (034) |.868 
Gewinn. 


Notizen. CI = Konfidenzintervall; LL = Untere Grenze; UL = Obere Grenze. 2 Referenzindikator; * р < .05, 
##n<.01,***p< .001 
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Tabelle 10.8 Kennwerte Dimensionen und Indikatoren — Erhebung 2.4 KI und Hochschule: 


Modell BDGS 


Item-ID | Itemformulierung „Digitale 


Daten ...“ 


В (SE) 95 Ф CI [LL; UL] 


Genauigkeit 


B (SE) 


СЕ1 ... ermöglichen ein genaues 4.566 (.085) | [4.395; 4.707] 1 776 
Verständnis der Welt. 

GE2 ... ermöglichen ein exaktes 3.964 (.092) | [3.769; 4.138] 1.067*** (.088) | .763 
Verständnis der Welt. 

GE3 ... ermöglichen ein objektives | 4.151 (.090) | [3.960; 4.312] .986*** (.089) 717 
Verständnis der Wirklichkeit. 

Wissen 

WI ... verhelfen zu neuem Wissen. | 5.727 (.066) | [5.587; 5.862] 19 814 

WI ... führen zu neuen Fakten. 5.388 (.072) | [5.253; 5.527] .838*** (077) .627 

w3 ... verhelfen zu neuen 5.638 (.065) | [5.501; 5.757] 1.071*** (.070) |.879 
Erkenntnissen. 

Individueller Nutzen 

INI ... erzeugen für mich 4.273 (.090) 4.075; 4.441 1% 884 
persönlich einen Mehrwert. 

IN2 ... führen für mich zu Vorteilen. | 4.405 (.083) 4.252; 4.579 .881*** (.049) .838 


IN3 ... haben für mich persönlich 4.382 (.079) 4.228; 4.543 .825*** (.047) .823 

positive Auswirkungen. 
Gesellschaftlicher Nutzen 

GNI ... erzeugen einen Mehrwert 4.523 (.078) 4.378; 4.658 J? .878 
für die Gesellschaft. 

GN2 ... führen zu gesellschaftlichen | 4.242 (.076) 4.274; 4.566 .874*** (.054) .784 
Vorteilen. 

GN3 ... sind ein gesellschaftlicher 4.306 (.081) 4.151; 4.464 1.001*** (.056) | .847 


Gewinn. 


Notizen. CI = Konfidenzintervall; LL = Untere Grenze; UL = Obere Grenze. 2 Referenzindikator; * р < .05, 


жар < .01, *** р < .001 
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Mit Blick auf die Regressionskonstanten fällt auf, dass bei den Items 
der Dimension Genauigkeit die Regressionskonstanten in den Erhebungen um 
den Skalenmittelpunkt oder leicht darunterliegen, was eine differenzierte Ein- 
schätzung dieser Dimension indiziert. Gleiches gilt für die Dimensionen des 
individuellen Nutzens sowie des gesellschaftlichen Nutzens, deren Regressionskon- 
stanten ebenfalls um den Skalenmittelpunkt liegen. Allerdings ist der individuelle 
Nutzen im Verhältnis fast durchgängig geringer ausgeprägt als der gesellschaft- 
liche Nutzen. Besonders hoch ausgeprägt sind in den vorliegenden Erhebungen 
hingegen erneut die Indikatoren der Dimension des Wissensgewinns: In allen 
Erhebungen ist diese Dimension mit Blick auf die Regressionskonstanten der ein- 
zelnen Indikatoren stark positiv ausgeprägt, weshalb die entsprechend formulierte 
Hypothese la angenommen wird. 

In Tabelle 10.9 finden sich die Inter-Korrelationen der vier Dimensionen des 
BDGS, die wie in Studie 1 auch in allen Erhebungen der Studie 2 erneut hoch 
miteinander korrelieren. Hohe Ausprägungen einer Dimension gehen für gewöhn- 
lich mit hohen Ausprägungen der anderen Dimensionen einher. Die Hypothese 
1b, die besagt, dass die Dimensionen des BDGS positiv miteinander kovariieren, 
wird mithin angenommen. 


Prüfung auf Messinvarianz 

Auch für die vier Erhebungen 2.1 bis 2.4 in Studie 2 wurde eine Prüfung auf 
Messinvarianz durchgeführt. Die Ergebnisse in Tabelle 10.10 zeigen, dass mit 
Blick auf den Chi-Quadrat-Differenztest die Modelle mit metrischer und skalarer 
Invarianz eine signifikant schlechtere Anpassungsgüte zeigen. Allerdings müssen 
erneut die Stichprobengröße (n = 2364) sowie die Anzahl der verglichenen Grup- 
pen sowie die Größe des geschätzten Modells berücksichtigt werden, die einen 
Einfluss auf den Test auf Messinvarianz haben. Auch hier tendiert der strenge 
Chi-Quadrat-Differenztest schnell dazu, ein signifikantes Ergebnis zu erbringen 
(Putnick & Bornstein, 2016). Es werden aus diesem Grund an dieser Stelle inkre- 
mentelle Fit-Maße zur Beurteilung der Messinvarianz herangezogen (F. F. Chen, 
2007; Meade et al., 2008), die eine Einschätzung erlauben, in welchem Grad 
sich das Modell durch die Gleichheitsrestriktionen verschlechtert. So wird mit 
Blick auf Tabelle 10.10 ersichtlich, dass das Modell mit der skalaren Invarianz 
bezüglich der inkrementellen Fit-Maße des TLI und des RMSEA eine höhere 
bzw. mindestens gleich hohe Anpassungsgüte zeigt, verglichen mit den Model- 
len mit konfiguraler Invarianz bzw. metrischer Invarianz. Das bedeutet, dass 
das Modell mit den Gleichheitsrestriktionen eine signifikant, jedoch nicht sub- 
stantiell schlechtere Anpassungsgüte zeigt und mithin von starker Messinvarianz 
ausgegangen wird. 
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Tabelle 10.9 Korrelationsmatrix — Erhebungen der Studie 2: Finales Modell BDGS 


Genauigkeit | Wissensgewinn | Individueller | Gesellschaftlicher Nutzen 
Nutzen 
Genauigkeit 
Erhebung 2.1 EU und KI | 1 .685*** 517996 .663*** 
2.2a — Medizin 1 716*** .643*** 25979 
2.2b — Personalwesen 1 AZ 623%% .685*** 
2.2с — Bankensektor 1 „он ST VON biii 
2.3a 1 085*** 28 .604*** 
— Laboruntersuchung 
2.3b — Online-Befragung |1 .629*** Rev aa .648*** 
24 1 .665*** 466*** 627*** 
Wissensgewinn 
Erhebung 2.1 EU und KI 1 6337" .680*** 
2.2а — Medizin 1 .661*** Л41*** 
2.2b — Personalwesen 1 664% * Л40*** 
2.2c — Bankensektor 1 PEE .694*** 
2.3а 1 В» Оди 
— Laboruntersuchung 
2.3b - Online-Befragung 1 215% 59454 
2.4 1 .549*** 01896 
Individueller Nutzen 
Erhebung 2.1 EU und KI 1 .869*** 
2.2а — Medizin 1 .883*** 
2.26 — Personalwesen 1 Re al 
2.2c — Bankensektor 1 kee 
2.3а 1 .870*** 
— Laboruntersuchung 
2.35 — Online-Befragung 1 .806*** 
2.4 1 Ogres 


Notizen. * p < .05, ** p < .01, *** p < .001 
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Durch die Festsetzung der Gleichheitsrestriktionen lassen sich bei starker Mes- 
sinvarianz die Mittelwerte der latenten Konstrukte über die Gruppen hinweg 
vergleichen. Mit Blick auf die Regressionskonstanten zeigte sich, dass die studen- 
tische Stichprobe in Erhebung 2.4 KI und Hochschule die bisher höchsten Werte 
auf den einzelnen BDGS-Dimensionen erzielt. Das BDGS ist in dieser Gruppe 
am stärksten ausgeprägt. Sie wurde daher als Referenzgruppe festgelegt, deren 
Faktor-Mittelwerte auf 0 restringiert sind (siehe Tabelle 10.11). 

Es zeigt sich mit Blick auf die Mittelwerte, dass für fast alle Dimensionen 
des BDGS signifikante Unterschiede zwischen der Erhebung 2.4 KI und Hoch- 
schule und den anderen Erhebungen bestand. Das BDGS ist bei den Erhebungen 
2.1 EU und KI, 2.2 KI-Bedrohung und 2.3b Krankenversicherung geringer ausge- 
prägt, die alle über das SoSci-Panel durchgeführt wurden. Nur die Erhebung 2.3a 
Krankenversicherung, die ebenfalls mit einem studentischen Sample im Labor 
durchgeführt wurde, hat eine ähnliche, wenn auch bis auf die Dimension des 
gesellschaftlichen Nutzens signifikant geringere Ausprägung. 


10.8 Diskussion der Ergebnisse des BDGS in den 
Erhebungen 2.1 bis 2.4 


Es zeigt sich, dass das BDGS auch in den Erhebungen 2.1 bis 2.4 reliabel messbar 
ist. Die Anpassungsgüte ist weitgehend zufriedenstellend und auch die Messä- 
quivalenz ist zwischen den Erhebungen gegeben. Das BDGS zeigt sich auch in 
Studie 2 als ein stabiles Wahrnehmungsmuster. 

Mit Blick auf die Ausprägung der einzelnen Dimensionen bestätigt sich der 
Eindruck aus Studie 1. Erwartungen an die Genauigkeit der Daten sind variabel 
und liegen jeweils um den Skalenmittelpunkt der Indikatoren, vereinzelt gering- 
fügig darunter. Der vermeintlichen Exaktheit und Objektivität des Verständnisses 
der Welt, das durch digitale Daten ermöglicht wird, wird also durchaus aus- 
gewogen betrachtet und nicht durchweg von den Befragten vorausgesetzt. Ein 
ähnliches Bild zeigt sich für den aus digitalen Daten gezogenen individuellen und 
gesellschaftlichen Nutzen. Auch hier wird von den Befragten durchaus abgewo- 
gen und im Durchschnitt keine eindeutige Zustimmung abgegeben. Es fällt jedoch 
auf, dass die individuellen Nutzenerwartungen jeweils etwas niedriger ausfallen 
als die Erwartungen, dass die Allgemeinheit von der Sammlung und Auswertung 
der großen digitalen Datenbestände profitiert. Hier wird die Kehrseite fortschrei- 
tender Digitalisierung, wie etwa Verletzungen der Privatsphäre oder anderweitige 
Nachteile als ‚gläserne‘ Konsumierende, womöglich durchaus wahrgenommen 
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und schlägt sich in der Erwartung etwaiger Nachteile nieder, die dem Indivi- 
duum aus der weitreichenden Sammlung und Auswertung persönlicher Daten 
entstehen, auch wenn die Gesellschaft insgesamt von digitalen Daten profitieren 
mag. Die Einschätzung des Nutzens der Datensammlung und -auswertung wird 
mithin ambivalent beurteilt, während die Befragten auch in den Erhebungen der 
Studie 2 durchweg einen Wissensgewinn aus den Daten erwarten. Der Mythos 
eines weitreichenden Erkenntnisgewinns aus digitalen Daten findet hier wie auch 
in Studie 1 Resonanz und führt zu einer allgemeinen Zustimmung darin, dass 
Wissen aus den Daten generiert werden kann. 

Dabei fällt auf, dass das BDGS in den beiden studentischen Samples beson- 
ders hoch ausgeprägt ist. Ein möglicher Grund mag darin liegen, dass sich in 
diesen Gruppen besonders viele der sogenannte Digital Natives finden (siehe 
Abschnitt 9.1.2). Zum einen sind heutige Studierende mit der Digitalisierung 
aufgewachsen und mit der täglichen Nutzung von Digitaltechnik vertraut. Sie 
gehören zur ersten Generation, die keine direkten Vergleichsmöglichkeiten zu 
einer Zeit hat, in der die Verbreitung und Nutzung von Computern noch nicht 
zum privaten und beruflichen Alltag gehörte. Zum anderen haben sie weni- 
ger (Lebens-)Erfahrung, befinden sich am Beginn des Berufslebens und sind 
neuen Entwicklungen womöglich insgesamt offener gegenüber eingestellt. Im 
Zuge des gesellschaftlichen Diskurses um die Wissensgesellschaft wird auch die 
besondere Bedeutung von Wissen und Bildung für den Lebenserfolg des Indi- 
viduums hervorgehoben, so dass in den letzten Jahrzehnten nicht nur immer 
mehr Schüler*innen die Hochschulreife erlangen, sondern auch mehr ein Stu- 
dium beginnen (Autorengruppe Bildungsberichterstattung, 2018). Es verwundert 
daher nicht, dass der Mythos der digitalen Daten auch von dieser Gruppe auf- 
genommen wird und hohe Erwartungen an das positive Veränderungspotential 
digitaler Datensammlung und -verwertung bestehen. 


10.9 Ergebnisse der Erhebung 2.1 EU und KI 
10.9.1 Datenauswertung und Ergebnisse 


Die Hypothesen werden mit Hilfe eines Strukturregressionsmodells in AMOS 23 
geprüft. Zur Prüfung der Messäquivalenz der Dimensionen des ВОС$ und der 
Legitimitätswahrnehmung sowie der finalen Prüfung der modellierten Zusam- 
menhänge wird eine MGKA durchgeführt. Dabei wurden die Manipulationen 
der Experimentalkonditionen hier nicht als manifeste unabhängige Variablen 
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(dummy-codiert) modelliert, sondern die Konditionen wurden als jeweils eigen- 
ständige Gruppe betrachtet, in denen dann unterschiedliche Effekte des BDGS 
zulässig und direkt vergleichbar sind. Im jeweiligen Modell werden die Mess- 
modelle der BDGS-Dimensionen Genauigkeit, Wissensgewinn sowie individueller 
Nutzen und gesellschaftlicher Nutzen als latente unabhängige Variablen modelliert 
(siehe Abbildung 10.1). Die BDGS-Dimensionen nehmen im Modell dann einen 
Einfluss auf die vier in Abschnitt 10.6.1 beschriebenen Legitimitäts-Dimensionen, 
die als abhängige endogene Variablen modelliert sind. 


Prüfung der Messäquivalenz 

Ein geschätztes Modell der MGKA (Modell 1) zeigt mit Blick auf den strengen 
Chi-Quadrat-Test eine unzureichende Anpassungsgüte (X?(614) = 881.125, p = 
< .001; RMSEA = .028 [.023, .032]; TLI = .959). Die inkrementellen Fit-Maße 
indizieren eine noch ausreichende Anpassungsgüte. Die insgesamt unzufrieden- 
stellende Anpassungsgüte liegt hier auch an der Größe des Modells mit 22 
beobachteten manifesten Variablen sowie sieben latenten Faktoren und ergibt sich 
mit Blick auf die Unterscheidung der drei Konditionen sowie der Stichproben- 
größe. Es wird nun ein zweites Modell für die drei Konditionen gerechnet, das 
der Multi-Kollinearität der BDGS-Dimensionen Rechnung trägt und entsprechend 
mit Gleichheitsrestriktionen der Strukturgewichte des BDGS auf die Legitimitäts- 
dimensionen spezifiziert ist. Durch die Prüfung mittels Gleichheitsrestriktionen 
wird verdeutlicht, inwieweit die einzelnen Dimensionen gleiche oder ungleiche 
Effekte auf die abhängigen Variablen haben. Die Restriktionen in diesem Modell 
2 führen nicht signifikant zu einer Verschlechterung der Anpassungsgüte (AX? 
= 25.808, Adf = 36; р = .896). Das bedeutet, dass dem Modell 2 mit den 
Gleichheitsrestriktionen der Vorzug zu geben ist. Gleichzeitig zeigt sich im unre- 
stringierten Modell 1 in der Копадрм, dass es doch zu unterschiedlichen Effekten 
im Verhältnis einzelner Dimensionen des BDGS in dieser Kondition kommt. Da 
der Einfluss des BDGS in dieser Kondition von besonderem Interesse ist, wird das 
Modell 2 erneut respezifiziert und ein Modell 3 geprüft, in dem die Gleichheitsre- 
striktionen teilweise freigesetzt werden. Eine Übersicht über die Anpassungsgüte 
der drei Modelle findet sich in Tabelle 10.12. 

Die freigesetzten Gleichheitsrestriktionen in diesem Modell 3 führen nicht 
signifikant zu einer Verschlechterung der Anpassungsgüte gegenüber Modell 2 
(AX? = .363, Adf = 1; р = .547). Nachfolgend werden daher die Ergebnisse 
des Modells 3 berichtet. 
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Der Einfluss des BDGS im Rahmen der Legitimitätswahrnehmung 

Zunächst muss auf die Kondition des HDM eingegangen werden, die als Refe- 
renzkondition betrachtet wird und mithin die Kontrollgruppe darstellt. Der Status 
quo dient zur Prüfung des allgemeinen Einflusses des BDGS auf die Legiti- 
mitätsbewertung. Es könnte auch in dieser Kondition durchaus sein, dass sich 
starke Einflüsse des BDGS zeigen: Etwa, weil Befragte mit hoher Ausprägung 
der Dimensionen des BDGS eine allgemein unterschiedliche Wahrnehmung poli- 
tischer Legitimität haben als Personen mit niedriger Ausprägung. Hierfür gibt 
es zwar keine Annahmen und Anhaltspunkte, eine Prüfung ist dennoch geboten. 
Die Parameterschätzungen der Pfadkoeffizienten für diese Kondypm finden sich 
in Tabelle 10.13. Es zeigt sich, dass die Dimensionen des BDGS keinen signifi- 
kanten Einfluss auf die Legitimitätswahrnehmung in der Kontrollgruppe haben, 
außer auf die Akzeptanz der Entscheidung. Hier zeigt sich ein signifikanter Effekt 
(В = .041, SE = .019. р < .028). Dieser ist als gering zu bewerten (BGenauigkeit 
= .049; Bwissensgewinn = ‚045; Pindividueller_Nutzen = ‚052; PGesellschaftlicher_Nutzen = 
.048). 

In der Kondapm zeigt sich, dass die BDGS-Dimension des individuellen Nut- 
zens einen mittleren negativen Einfluss (В = -.205, SE = .099. р = .038, В = 
—.411) auf die wahrgenommene Legitimität des Inputs hat (siehe Tabelle 10.14). 
Zudem ergab sich, dass das BDGS insgesamt einen positiven Einfluss auf 
die wahrgenommene Throughput-Legitimität hat (В = .061, SE = .015. р < 
.001), der als gering zu bewerten ist (BGenauigkeit = -086; BWissensgewinn = .080; 
Bindividueller_Nutzen = -092; BGesellschaftlicher_Nutzen = -085). Darüber hinaus gibt es 
einen positiven Einfluss des BDGS auf die Zielerreichung (В = .059, SE = .015. 
p < .001) sowie die Akzeptanz der Entscheidung (В = .048, SE = .018. p = .036). 
Sowohl für den Einfluss des BDGS auf die Zielerreichung (BGenauigkeit = .080; 
Bwissensgewinn = 075; Bindividueller_Nutzen = .086; PGesellschaftlicher_Nutzen = .080) 
als auch auf die Akzeptanz der Entscheidung (BGenauigkeit = -054; Bwissensgewinn 
= .051; Bindividueller_ Nutzen = .058; PGesellschaftlicher_ Nutzen = -054) ist der Effekt 
ebenfalls gering. 

Hypothese 2.1а wird dahingehend angenommen, als dass sich ein positiver 
Effekt des BDGS allgemein auf die Throughput-Legitimität für die erwartete 
Zielerreichung und die Akzeptanz der Entscheidung zeigt. Mit Blick auf die 
Input-Legitimität ergibt sich jedoch ein anderes Bild. Die individuellen Nutze- 
nerwartungen haben einen negativen Einfluss auf die Input-Legitimität, während 
die anderen Dimensionen des BDGS keinen Einfluss haben. 
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Tabelle 10.13 Parameterschätzungen der Pfadkoeffizienten in Erhebung 2.1 EU und КІ - 


Kondition HDM 


Unabhängige 
Variablen (UV) 


Genauigkeit 


Wissensgewinn 


Individueller Nutzen 


Gesellschaftlicher 
Nutzen 


Genauigkeit 


Endogene Variable (AV) 


Input-Legitimität 


Throughput-Legitimität 


В (SE) 


.0288 (.017) 
.0288 (.017) 


.028? (.017) 


.028° (.017) 


031° (.017) 


Wissensgewinn .031> (.017) |.074 \.038 
Individueller Nutzen .031? (.017) .074 .033 
Gesellschaftlicher .031b (.017) .074 .041 
Nutzen 

Genauigkeit Zielerreichung .016° (.014) .257 .024 
Wissensgewinn .016° (.014) .257 .023 


Individueller Nutzen 


.016° (.014) 


Gesellschaftlicher .016° (.014) 

Nutzen 

Genauigkeit Akzeptanz der 0414 (.019) .028 .049 
Wissensgewinn Entscheidung .0419 (.019) 1.028 1.045 


Individueller Nutzen 


Gesellschaftlicher 
Nutzen 


.0414 (.019) 


041% (.019) 


Notizen. 20:4 Werte der Regressionskonstanten mit gleichen Buchstaben wurden 
mit Gleichheitsrestriktionen der Strukturgewichte spezifiziert und haben daher 
identische Parameterschätzungen. 
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Tabelle 10.14 Parameterschätzungen der Pfadkoeffizienten in Erhebung 2.1 EU und КІ - 


Kondition ADM 

Unabhängige Variablen | Endogene Variable (AV) | B (SE) В 

(UV) 

Genauigkeit Input-Legitimität .019 (.069) 783 .036 

Wissensgewinn —.058 (.076) 445 | -.102 

Individueller Nutzen —.205 (.099) .038 |-.411 

Gesellschaftlicher .202 (.117) .083 .376 

Nutzen 

Genauigkeit Throughput-Legitimität .061b .001. | .086 
(.015) 

Wissensgewinn Geib 001. | .080 
(.015) 

Individueller Nutzen 061° ‚001. ‚092 
(.015) 

Gesellschaftlicher .061b .001. | .085 

Nutzen (.015) 

Genauigkeit Zielerreichung .059° .001. | .080 
(.015) 

Wissensgewinn ‚059° 001. | .075 
(.015) 

Individueller Nutzen .059° .001. | .086 
(.015) 

Gesellschaftlicher ‚059° 001. | .080 

Nutzen (.015) 

Genauigkeit Akzeptanz der 0484 .036 .054 

Entscheidung (.018) 

Wissensgewinn 0484 .036 .051 
(.018) 

Individueller Nutzen .048d .036 .058 
(.018) 

Gesellschaftlicher 0484 .036 .054 

Nutzen (.018) 


Notizen. 50 Werte der Regressionskonstanten mit gleichen Buchstaben wurden mit 
Gleichheitsrestriktionen der Strukturgewichte spezifiziert und haben daher identische 


Parameterschätzungen. 
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Tabelle 10.15 Parameterschätzungen der Pfadkoeffizienten in Erhebung 2.1 EU und КІ - 


Kondition Hybrid 


Unabhängige 
Variablen (UV) 


Genauigkeit 


Wissensgewinn 


Individueller Nutzen 


Gesellschaftlicher 
Nutzen 


Genauigkeit 


Endogene Variable (AV) 


Input-Legitimität 


Throughput-Legitimität 


В (SE) 


.038? (.016) 
.038° (.016) 


.038° (.016) 


038“ (.016) 


.030° (.015) 


Wissensgewinn .030° (.015) .049 .032 
Individueller Nutzen .030b (.015) .049 .037 
Gesellschaftlicher .030° (.015) .049 .034 
Nutzen 

Genauigkeit Zielerreichung .044° (.016) .008 .027 
Wissensgewinn .044° (.016) .008 .025 


Individueller Nutzen 


.044° (.016) 


Gesellschaftlicher .044° (.016) 

Nutzen 

Genauigkeit Akzeptanz der .0354 (.019) .063 .042 
Wissensgewinn Entscheidung .0354 ung .063 1.039 


Individueller Nutzen 


Gesellschaftlicher 
Nutzen 


.0354 (.019) 


.0354 (.019) 


Notizen. 20:4 Werte der Regressionskonstanten mit gleichen Buchstaben wurden 
mit Gleichheitsrestriktionen der Strukturgewichte spezifiziert und haben daher 
identische Parameterschätzungen. 


Der Einfluss des BDGS im Rahmen der hybriden Entscheidungsfindung 


Für die dritte Experimentalgruppe der Kondyypria (siehe Tabelle 10.15) zeigen 
sich signifikante Einflüsse des BDGS auf die wahrgenommene Input-Legitimität 
(В = .038, SE = .016. р = .016), die Throughput-Legitimität (В = .030, SE = 
.015. p = .049) sowie auf die Zielerreichung (В = .044, SE = .016. р = .008). 
Die Stärke der Effekte ist jedoch auch hier durchweg als gering zu bewerten. Es 
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findet sich kein Zusammenhang der BDGS-Dimensionen mit der Akzeptanz der 
Entscheidung. 

Hypothese 2.1b wird daher dahingehend angenommen, als dass ein aus- 
geprägtes BDGS zu einer höheren Legitimitätswahrnehmung des Inputs, des 
Throughputs und der Zielerreichung führt. Es zeigt sich lediglich kein Effekt 
des BDGS auf die Akzeptanz der Entscheidung. 


10.9.2 Diskussion der Ergebnisse von Erhebung 2.1 EU und 
KI 


Das aufgeworfene Forschungsinteresse in Erhebung 2.1 EU und KI interessierte 
sich für den Einfluss des BDGS in einem Szenario, in dem mit ADM eine 
KI-Anwendung am Beispiel des Budgetierungsprozesses der EU zum Einsatz 
kommt. Es stand zu vermuten, dass an Daten gerichtete Erwartungen als Bestand- 
teile des BDGS einen Einfluss auf die wahrgenommene Legitimität von Verfahren 
haben, bei denen im Rahmen datengestützter evidenzbasierter Politikgestaltung 
auf KI-Anwendungen zurückgegriffen wird und der menschliche Einfluss auf die 
Entscheidungsfindung ausgeklammert bzw. eingeschränkt ist. 

Die Ergebnisse der experimentellen Befragungsstudie zeigen dann für den 
Fall eines vollständig automatisierten Budgetierungsprozesses der EU auch, 
dass je ausgeprägter die Überzeugungen des Erkenntnis- und Nutzengewinns 
auf Grundlage digitaler Daten, desto höher die Legitimitätswahrnehmung des 
Throughputs sowie der beiden Output-Dimensionen, wobei sowohl die Erwar- 
tung der Zielerreichung höher ausfiel als auch die Akzeptanz der Entscheidung. 
Es zeigte sich jedoch auch, dass eine stärkere Wahrnehmung eines individuel- 
len Nutzens der Datensammlung und -verwertung sich entgegen der Hypothese 
negativ auf die wahrgenommene Legitimität des Inputs auswirkte und die übrigen 
BDGS-Dimensionen hier keinen Einfluss hatten. 

In diesem Szenario gingen explizit alle in der EU verfügbaren Datenbe- 
stände in die Analyse ein, was eine Bevorzugung oder Benachteiligung durch 
selektive Auswahl der Informationen verhinderte und eine Teilnahme aller Bür- 
ger*innen vermittelt durch ihre jeweiligen Daten ermöglichte. Hier hätte ein 
Effekt der gesellschaftlichen Nutzenerwartungen, der sich zwar zeigte, jedoch 
nicht signifikant war, darauf hingedeutet, dass in Hinsicht auf das vorgeworfene 
Demokratiedefizit der EU eine alle Bürger*innen umfassende Datenverwertung 
womöglich als durchaus demokratisch wahrgenommen hätte werden können. So 
zeigt sich jedoch mit Blick auf die Input-Legitimitat, dass Personen, die ganz all- 
gemein auf sich selbst bezogene Vorteile erwarten, dieses soeben als womöglich 
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demokratische bezeichnete Prozedere als weniger legitim wahrnehmen, womög- 
lich durch den fehlenden eigenen Einfluss im Entscheidungsprozess, auf den 
die Messung abstellt. Eventuell ist hier die wahrgenommene Selbstwirksamkeit 
so niedrig (Caprara et al., 2009), dass man zwar glaubt, dass man von Daten 
profitiert, jedoch im politischen Prozess die eigene Einzelmeinung nicht viel 
Wert ist, wenn große Datensätze zusammenkommen. Um diesen Zusammen- 
hang jedoch weiter zu beleuchten, bräuchte es zusätzliche Informationen zu den 
Befragten, wie etwa Informationen über deren Selbsteinschätzung und politische 
Überzeugungen, die im Rahmen der Befragung jedoch nicht erhoben wurden. 

In der hybriden Kondition, in der Politiktreibende basierend auf der Vorberei- 
tung durch eine KI-Anwendung noch einen Einfluss auf den Budgetierungspro- 
zess nehmen konnten, lässt sich im direkten Vergleich ein ebenfalls vorhandener, 
wenn auch geringerer Einfluss des BDGS auf die wahrgenommene Legitimität 
feststellen. Auch hier wurde im Rahmen der Einführung einer KI-Anwendung 
im Budgetierungsprozess erwartet, dass die Ausprägung des BDGS durchaus 
Erklärungskraft für die Legitimitätswahrnehmung hat. Es zeigt sich hier, dass 
je ausgeprägter das BDGS ausfällt, desto höher ist sowohl die wahrgenommene 
Input- und Throughput-Legitimität als auch die eingeschätzte Zielerreichung. 
Lediglich für die Akzeptanz der Entscheidung sind die Effekte zu gering, als 
dass ein Einfluss angenommen werden kann. 

Dies sind durchaus relevante Befunde zur Bewertung des menschlichen Kor- 
rektivs im Rahmen der Akzeptanz von automatisierter Entscheidungsfindung 
durch KI, die vor dem Hintergrund der Diskussionen um korrigierende mensch- 
liche Eingriffe in Daten und Algorithmen zu bewerten sind (Dietvorst et al., 
2018; Goldenfein, 2019). Soll die Fehlbarkeit der KI-Anwendungen durch eine 
Letztentscheidungsbefugnis von Menschen abgefedert oder gänzlich vermieden 
werden, führt dies hier in den Augen von Personen mit ausgeprägten Überzeu- 
gungen des BDGS nur zu einer zu leicht verringerten Legitimitätswahrnehmung 
im Vergleich mit der vollständig automatisierten Kondition. 

Dass im Szenario des Status quo das BDGS dann doch ausgerechnet einen 
Einfluss auf die Akzeptanz der Entscheidung hat, verwundert und sollte im 
Rahmen weiterführender Untersuchungen geprüft werden. Mögliche Einflüsse 
und Wechselwirkungen mit anderen Eigenschaften der Person wie etwa sozio- 
demografischer Variablen oder anderweitiger Einstellungen sind jedoch mit dem 
vorliegenden Design und der Stichprobengröße nicht realisierbar. 

Die Ergebnisse haben auch verdeutlicht, dass im vorliegenden Erklärungszu- 
sammenhang das BDGS meist gesamt genommen einen Einfluss zeitigte und nicht 
zwischen dem Einfluss einzelner Dimensionen unterschieden werden konnte. Das 
führt zu der Erkenntnis, dass je nach Forschungszusammenhang gut überlegt und 
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geplant werden sollte, wie die Messung des BDGS in die Erhebung und Ana- 
lyse eingeht. Im vorliegenden Fall wäre es bspw. aus forschungsökonomischen 
Gründen möglicherweise ausreichend gewesen, eine besonders relevante Dimen- 
sion zu identifizieren oder es könnte generell angedacht werden, für ähnlich 
gelagerte Studien eine Kurzskala mit den als wichtig befundenen Referenzin- 
dikatoren zu bilden. Da der Einsatz der BDGS-Skala jedoch noch weitgehend 
unerprobt war und in den vorliegenden Studien teils explorative Forschungsfra- 
gen und Erkenntnisinteressen formuliert wurden, bei denen durchaus individuelle 
Effekte der Dimensionen zu erwarten waren, ging weiterhin die vierdimensionale 
BDGS-Skala in die Untersuchungen mit ein. 

Alles in allem lässt sich abschließend feststellen, dass der Einfluss des BDGS 
im Rahmen der aufwändigen Untersuchungsanlage verhältnismäßig gering ist 
und die Reichweite der Befunde auf den ersten Blick insgesamt eher ernüch- 
ternd wirkt. Möglicherweise waren die vorgestellten hypothetischen Szenarien 
zu abstrakt und aktuell nicht relevant und realistisch für die Befragten, als dass 
sich große Unterschiede in der Bewertung der Kondition zwischen Personen 
mit unterschiedlich ausgeprägtem BDGS manifestieren. Auch die Unterscheidung 
zwischen einzelnen BDGS-Dimensionen war insgesamt zu voraussetzungsvoll 
und weitreichend, als dass sie in der vorliegenden Untersuchung mit der vor- 
handenen Samplegröße realisiert werden konnte. Dennoch zeigten sich etliche 
vermutete Einflüsse des BDGS. Auch kleine Effekte können dabei im Rahmen 
politischer Fragen weitreichende Folgen haben. So können schon geringe Unter- 
schiede und schwache Effekte bspw. im Rahmen knapper Wahlabstimmungen in 
politischen Fragen entscheidend sein und Einfluss auf die Gesellschaft haben. 


10.10 Ergebnisse der Erhebung 2.2 KI-Bedrohung 
10.10.1 Datenauswertung und Ergebnisse 


Zur Hypothesenprüfung wurde ein Strukturregressionsmodell in AMOS 23 spe- 
zifiziert und geprüft, bei dem die vier BDGS-Dimensionen einen Einfluss 
auf die beiden Dimensionen Entscheidungsempfehlung und Entscheidung der 
Bedrohungswahrnehmung von KI in den drei Anwendungsbereichen Medizin, 
Personalwesen und Bankensektor haben (siehe Abbildung 10.2). 

Für die Dimensionen des BDGS sowie für die beiden Dimensionen der 
KI-Bedrohungswahrnehmung wurden im vorliegenden Modell Gleichheitsrestrik- 
tionen für die Regressionsgewichte und -konstanten festgelegt, so dass die 
Kovarianzen und Pfadkoeffizienten sowie die Mittelwerte der latenten Faktoren 
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freigesetzt waren.! Zum einen werden so die Pfadkoeffizienten geschätzt und die 
vermuteten Zusammenhänge zwischen BDGS und der Bedrohungswahrnehmung 
gepriift werden. Zum anderen erlaubt dies einen Vergleich der wahrgenommenen 
Bedrohung zwischen den beiden KI-Funktionen sowie zwischen den Funktionen 
über die drei Anwendungsbereiche hinweg. 

Das spezifizierte Modell zeigt mit Blick auf den strengen Chi-Quadrat-Test 
eine unzureichende Anpassungsgüte (X?(412) = 571.620, p < .001; RMSEA = 
.021 [.017, .025]; TLI = .985), während die inkrementellen Fit-Maße eine aus- 
reichende Passung des Modells indizieren. Auch hier ist die gemeinsam geteilte 
Varianz als größtenteils unsystematisch einzuschätzen und auf die hohe Fallzahl 
zurückzuführen. Hinweise auf systematisch zustande kommende Varianzteilung 
zeigen sich mit Blick auf Indikatoren einer Dimension, die jenseits der gemein- 
samen Dimensionszugehörigkeit eine gemeinsam geteilte Varianz haben, die 
sich womöglich auch hier aus der ähnlichen Indikatorformulierung ergibt (siehe 
Abschnitt 9.1.3) und somit als kleiner und vernachlässigbarer Befragungseffekt 
gewertet wird. 

Auch an dieser Stelle wurden nun aufgrund des Problems der hohen Multi- 
Kollinearität der BDGS-Faktoren weitere Modelle mit Gleichheitsrestriktionen 
für die Strukturgewichte der BDGS-Dimensionen auf die abhängigen Variablen 
geprüft. Durch diese Prüfung mittels Gleichheitsrestriktionen wird verdeutlicht, 
inwieweit die einzelnen Dimensionen gleiche oder ungleiche Effekte auf die 
abhängigen Variablen haben. Da das Modell eine große Anzahl Pfade beinhal- 
tete und diese zusätzlich für die drei Szenarien geprüft werden mussten, kann 
an dieser Stelle nicht jeder Respezifikationsschritt einzeln dokumentiert wer- 
den. Es wird daher lediglich das zuvor geschätzte Modell 1 ohne Restriktionen 
mit einem Modell 2 mit vollständigen Gleichheitsrestriktionen verglichen sowie 
mit einem Modell 3 mit partiellen Restriktionen. Modell 3 wurde dahingehend 
respezifiert, als dass deutlich wird, welche latenten Faktoren im Rahmen der 
Multi-Kollinearität die gleiche Erklärungskraft haben. Der Vergleich der Modelle 


21 Eine Prüfung auf Messäquivalenz für die beidem Dimensionen Empfehlung und Algo- 
rithmic Decision-Making für die drei Anwendungsbereiche ergab partielle starke faktorielle 
Messinvarianz. Es bestand konfigurale und skalare Messinvarianz, allerdings unterschied 
sich die Faktorladung des Items ADM3 (Werte XADM3 Medizin = -741, KADM3_Personalwesen 
= .850, X}ADM3_Bankensektor = -902 im finalen geprüften Modell). Das Modell mit den partiel- 
len Gleichheitsrestriktionen für Regressionsgewichte und -konstanten zeigt keine signifikant 
schlechtere Anpassung als das Modell ohne diese Identitätsrestriktionen (AX? = 18.505, 
df = 14, p = .185). Die Faktorladung des Items ADM3 wurde daher für die Auswertung 
freigesetzt. 
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mit Hilfe eines Chi-Quadrat-Differenztests zeigt, dass das Modell 2 mit voll- 
ständigen Gleichheitsrestriktionen keine signifikant schlechtere Anpassungsgüte 
gegenüber dem Modell 1 mit freigesetzten Regressionsgewichten hat (AX? = 
27.503, df = 18, p = .070). Es zeigte sich mit Blick auf die Effekte im Modell 1, 
dass sich teilweise unterschiedliche Einflüsse der BDGS-Dimensionen finden. Das 
Modell 2 wurde entsprechend respezifiziert und auf Grundlage der Erkenntnisse 
aus Modell 1 wurden einige restringierte Regressionsparameter wieder freige- 
geben. Dies wird in den nachfolgenden Tabellen mit den Parameterschätzungen 
durch einen gemeinsam geteilten Buchstaben indiziert. Der Vergleich der Modelle 
zeigt (siehe Tabelle 10.16), dass das Modell 2 eine signifikant schlechtere Anpas- 
sungsgüte gegenüber dem Modell 3 hat (AX? = 22.205, df = 6, p = .001). 
Modell 3 hat jedoch keine signifikant schlechtere Anpassungsgüte als Modell 1 
(AX? = 5.297, df = 12, p = .947). Modell 3 wird daher der Vorzug gegeben. 


Der Einfluss des BDGS auf die Bedrohungswahrnehmung der Funktionen von KI 
bei der Behandlung von Krankheiten 

Zunächst wird der Einfluss des BDGS im Anwendungsbereich der Medizin im 
Rahmen der Erkennung und Behandlung von Krankheiten in den Blick genom- 
men. Wie in Tabelle 10.17 ersichtlich wird, ist der Einfluss des BDGS als gering 
zu bewerten. 

Der Glaube an die Genauigkeit von digitalen Daten hat einen negativen Ein- 
fluss auf die Ausprägung der Bedrohungswahrnehmung von ADM im Kontext 
medizinischer Behandlungsentscheidungen. Je stärker der Glaube daran, dass 
digitale Daten ein objektives und exaktes Verständnis der Wirklichkeit ermögli- 
chen, desto geringer sowohl die Bedrohungswahrnehmung einer KI-Anwendung, 
die eine Behandlung empfiehlt (BGenauigkeit = — 199) als auch automatisiert eine 
Entscheidung über die konkrete Behandlung einer Krankheit trifft (BGenauigkeit 
= -.199). Während die Genauigkeit auf die Empfehlung einen geringen Ein- 
fluss hat, haben die drei anderen Dimensionen einen noch kleineren Einfluss 
(Bwissensgewinn = —.058; Bindividueller_Nutzen = —.080; PGesellschaftlicher_Nutzen = 
.069). Bei der Entscheidung über eine Behandlung findet sich auch bei den 
Nutzen-Dimensionen ein geringer negativer Einfluss auf die Bedrohungswahr- 
nehmung des ADM (Pjndividueller_Nutzen = —.199; PGesellschaftlicher_Nutzen = — 172). 
Die Dimension des Wissensgewinns hat hier keinen signifikanten Einfluss. Der 
Blick auf die Squared Multiple Correlations (SMC) offenbart einen Erklärungs- 
anteil der BDGS-Dimensionen an den beiden Funktionen: Interpretiert wie das 
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Bestimmtheitsmaß R? bei der linearen Regression?” werden 13.3 % der Varianz 


der Empfehlung (SMCEmpfehlung Medizin = .133) und 17.4 % der Varianz der ADM 
(GM Am Medizin = .174) durch die Dimensionen des BDGS erklärt. 


Tabelle 10.17 Parameterschätzungen der Pfadkoeffizienten in Erhebung 22а 
KI-Bedrohung — Anwendungsbereich Medizin 


Exogene Variablen (UV) Endogene Variable (AV) | B (SE) р В 

Genauigkeit Empfehlung einer —.117 (.055) .034 | -.199 
Wissensgewinn Behandlung -.047% (.023) .043 |-.058 
Individueller Nutzen —.047* (.023) .043 | —080 
Gesellschaftlicher Nutzen —.047* (.023) .043 | —.069 
Genauigkeit Entscheidung über eine |-.124P (.023) | <.001 |-.199 
Wissensgewinn Behandlung (ADM) .131 (.087) .130 .152 
Individueller Nutzen —.124> (.023) | <.001 |-.199 
Gesellschaftlicher Nutzen —.124° (.023) | <.001 |-.172 


Notizen. *> Werte der Regressionskonstanten mit gleichen Buchstaben wurden mit 
Gleichheitsrestriktionen der Strukturgewichte spezifiziert und haben daher identische 
Parameterschätzungen. 


Der Einfluss des BDGS auf die Bedrohungswahrnehmung der Funktionen von 
KI bei der Eignungsfeststellung und Einstellung von Bewerber*innen auf einen 
Arbeitsplatz 

Als Nächstes wird der Einfluss des BDGS im Anwendungsbereich des Perso- 
nalwesens bei der Eignungsfeststellung und Einstellung von Bewerber*innen auf 
einen Arbeitsplatz in den Blick genommen. Wie in Tabelle 10.18 ersichtlich wird, 
ist der Einfluss des BDGS auch hier als gering zu bewerten und zeigt hinsichtlich 
der Dimensionen ein differenzierteres Bild. 


22 Hier sei auf die Anmerkungen von Weiber und Mühlhaus (2014) zu den Squared mul- 
tiple Correlations verwiesen: „Die Squared multiple Correlations (SMC) der Konstrukte 
geben an, wie viel Prozent der Varianz der latent endogenen Variablen durch die anderen 
latenten Größen erklärt wird. Sie können damit analog zum Bestimmtheitsmaß (R?) bei der 
linearen Regression interpretiert und bewertet werden. Für die Interpretation der R?-Werte 
bei Kovarianzstrukturanalysen liegen jedoch keine Empfehlungen vor, so dass hier auf die 
bei Anwendung von PLS-Modellen gängigen Richtwerte zurückgegriffen wird. So beurteilt 
bspw. Chin (1998, S. 323) R?-Werte in einem von ihm analysierten Modell von 0,19 als 
‚schwach‘, von 0,33 als ‚moderat‘ und von 0,66 als ‚substantiell‘““ (Weiber & Mühlhaus, 
2014, S. 230). 
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Der Glaube an den gesellschaftlichen Nutzen der Verwertung digitaler Daten- 
bestände sowie der erwartete Wissensgewinn haben einen negativen Einfluss 
auf die Ausprägung der Bedrohungswahrnehmung der ausgesprochenen KI- 
Empfehlungen bei der Bewerbung auf einen Arbeitsplatz. Je stärker der Glaube 
daran, dass digitale Daten Wissen bereitstellen (Bwissensgewinn = —.238) sowie 
der Gesellschaft einen Nutzen bringen (PGesellschaftlicher Nutzen = — 251), desto 
geringer die Bedrohungswahrnehmung einer KI-Anwendung, die eine Empfeh- 
lung über die Einstellung von Bewerber*innen auf einen Arbeitsplatz ausspricht. 
Die Dimensionen der Genauigkeit und des individuellen Nutzens haben hingegen 
keinen signifikanten Einfluss. 

Im Rahmen der Bedrohungswahrnehmung einer automatisierten Entschei- 
dung zeigt sich, dass die Dimensionen Wissensgewinn (Bwissensgewinn = -208) 
und der erwartete individuelle Nutzen (Bindividueller_Nutzen = -253) einen steigern- 
den Einfluss haben. Je höher jedoch der erwartete Nutzen für die Gesellschaft, 
desto deutlich geringer die Bedrohungswahrnehmung (BGesellschaftlicher_Nutzen = 
—.484). Die Genauigkeit hat keinen signifikanten Einfluss. Auch der Blick auf 
die SMC offenbart einen geringen Erklärungsanteil der BDGS-Dimensionen 
an den beiden Funktionen: Es werden 12.5 % der Varianz der Empfeh- 
lung (SMCEmpfehlung Personalwesen = -125) und 7.4 % der Varianz der ADM 
(SMCADM Personalwesen = -074) durch die Dimensionen des BDGS erklärt. 


Tabelle 10.18 Parameterschätzungen der Pfadkoeffizienten in Erhebung 2.2b 
KI-Bedrohung — Anwendungsbereich Personalwesen 


Exogene Variablen (UV) | Endogene Variable (AV) В (SE) p В 

Genauigkeit Empfehlung einer —.002 (.072) .983 | -.002 
Wissensgewinn Personaleinstellung —.1772 (.053) | <.001 | -.238 
Individueller Nutzen .084 (.067) 210 | .137 
Gesellschaftlicher Nutzen —177* (.053) | <.001 |-.251 
Genauigkeit Entscheidung tiber eine —.071 (.055) 194 |-.138 
Wissensgewinn Personaleinstellung (ADM) | 118b (047) | .013 | .208 
Individueller Nutzen ‚1185 (.047) .013 | .253 
Gesellschaftlicher Nutzen —.260 (083) .002 | —484 


Notizen. ®® Werte der Regressionskonstanten mit gleichen Buchstaben wurden mit 
Gleichheitsrestriktionen der Strukturgewichte spezifiziert und haben daher identische 
Parameterschätzungen. 
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Tabelle 10.19 Parameterschätzungen der Pfadkoeffizienten in Erhebung 2.2c 
KI-Bedrohung — Anwendungsbereich Bankensektor 
Exogene Variablen (UV) Endogene Variable (AV) | B (SE) p В 
Genauigkeit Empfehlung einer —.086° (.012) |<.001 |-.119 
Wissensgewinn Kreditvergabe —.086? (.012) |<.001 |-.108 
Individueller Nutzen —.086? (.012) |<.001 |-.129 
Gesellschaftlicher Nutzen —.086% (.012) |<.001 |-.109 
Genauigkeit Entscheidung über eine |-.066? (.011) |<.001 |-.101 
Wissensgewinn Kreditvergabe (АРМ) |_ 966.011) |<.001 |-.091 
Individueller Nutzen —.066° (.011) |<.001 |-.109 
Gesellschaftlicher Nutzen —.066° (.011) |<.001 |-.092 


Notizen. *> Werte der Regressionskonstanten mit gleichen Buchstaben wurden mit 
Gleichheitsrestriktionen der Strukturgewichte spezifiziert und haben daher identische 
Parameterschätzungen. 


Der Einfluss des BDGS auf die Bedrohungswahrnehmung der Funktionen von KI 

bei der Kreditvergabe im Bankensektor 

Zuletzt wird der Einfluss des BDGS im Anwendungsbereich der Kreditvergabe 

im Bankensektor adressiert. Wie in Tabelle 10.19 ersichtlich ist der Einfluss des 

BDGS auch hier als gering zu bewerten, zeigt jedoch ein recht einheitliches Bild. 
Für das Szenario der Kreditvergabe zeigt sich, dass die Dimensionen des 

BDGS einen kleinen negativen Einfluss auf die Ausprägung der Bedrohungs- 


wahrnehmung von Empfehlungen (BGenauigkeit = —.119; Bwissensgewinn = —108; 
Pindividueller_Nutzen = -.129; PGesellschaftlicher_Nutzen = -.109) und ADM durch KI- 
Anwendungen (BGenauigkeit = —.101; Bwissensgewinn = —091; Bindividueller_Nutzen 


= -.109; BGesellschaftlicher_Nutzen = —-092) haben. Dabei offenbart der Blick auf 
die SMC, ähnlich wie im medizinischen Kontext zuvor, durchaus einen geringen 
Erklärungsanteil der BDGS-Dimensionen an den beiden Funktionen: Es werden 
16.9 % der Varianz der Empfehlung (SMCempfehlung_Bankensektor = .169) und 12 % 
der Varianz der ADM (ЅМСАрм Bankensektor = .120) durch die Dimensionen des 
BDGS erklärt. 

Die Hypothese 2.2 wird dahingehend angenommen, als dass das BDGS bzw. 
einzelne Dimensionen einen negativen Einfluss auf die Bedrohungswahrnehmung 
von KI-Anwendungen haben. Allerdings zeigt sich auch, dass es in Abhängigkeit 
vom Anwendungsszenario und der Funktion der KI mitunter zu abweichenden 
mitunter sogar gegenläufigen Effekten kommen kann. 
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10.10.2 Diskussion der Ergebnisse von Erhebung 2.2 
KI-Bedrohung 


Es zeigt sich, dass das BDGS bzw. einzelne zugehörige Dimensionen zwar durch- 
aus dazu beitragen können die Varianz der Bedrohungswahrnehmung durch KI 
in unterschiedlichen Anwendungsbereichen zu erklären. Die Einflüsse des BDGS 
im Allgemeinen und der einzelnen Dimensionen im Speziellen zeichnen ein 
uneinheitliches Bild. Dabei muss jedoch berücksichtigt werden, dass auch in 
der vorliegenden Studie die bereits im Abschnitt 10.2 genannten Limitationen 
bezüglich der Stichprobengröße und somit der statistischen Power in den vor- 
liegenden Forschungszusammenhängen gelten: Das eigentliche Ziel der Studie 
war die Skalenkonstruktion der Bedrohungswahrnehmung von KI, es gab keine 
konkreten Annahmen bezüglich der Stärke der Zusammenhänge und ausführ- 
liche Simulationen zur Powerberechnung konnten nicht durchgeführt werden. 
Letztendlich indizieren die Daten, dass eine hohe Ausprägung der jeweiligen 
BDGS-Dimensionen im Zusammenhang der Anwendungen zwar eine mindernde 
Wirkung auf das wahrgenommene Bedrohungspotential aufweisen, diese jedoch 
je nach Kontext variiert und unterschiedlich stark ausfällt. Einzelne Dimensionen 
indizieren zudem gegenläufige Effekte, was ebenfalls diskutiert werden muss. 

So zeigt sich bspw. für den Anwendungsfall der medizinischen Behand- 
lung, dass die Dimensionen des BDGS einen mindernden Einfluss auf die 
Bedrohungswahrnehmung einer KI hat, die auf Datengrundlage eigenständige 
Empfehlungen ausspricht oder Entscheidungen trifft. Ist das BDGS ganz allge- 
mein hoch ausgeprägt und wird den Daten im Speziellen noch hohe Objektivität 
und Präzision zugeschrieben, vermindert dies die Bedrohungswahrnehmung von 
KI-Anwendungen, die medizinische Behandlungen empfehlen. Wird automatisiert 
über eine Behandlung entschieden, zeigt sich, dass Personen mit ausgeprägtem 
BDGS hierbei weniger Bedrohung empfinden und dem Verfahren folglich positi- 
ver gegenüber eingestellt sind. Nur die Dimension des Wissensgewinns stellt hier 
eine Ausnahme da, wobei nur spekuliert werden könnte, warum sich bei dieser 
kein signifikanter Effekt zeigt. Der Einsatz von KI-Anwendungen bei der medizi- 
nischen Behandlung wird mithin von Personen mit ausgeprägtem BDGS weniger 
kritisch betrachtet. 

Auch im Rahmen der Eignungsfeststellung und Einstellung von Bewer- 
ber*innen auf einen Arbeitsplatz zeigt sich mit Blick auf die Empfehlung, dass 
Personen mit hohen Erwartungen an den Wissensgewinn und den gesellschaft- 
lichen Nutzen weniger Bedrohung empfinden. Hier schlagen die vermeintlichen 
Vorteile des datenbasierten Verfahrens im Rahmen einer Bestenauswahl durch: 


10.10 Ergebnisse der Erhebung 2.2 Kl-Bedrohung 261 


Dass in den Daten erkannt werden kann, wer sich für einen Arbeitsplatz eig- 
net, und dass dieses Verfahren für die Gesellschaft insgesamt zu Vorteilen führt, 
wenn tatsächlich die geeignetste Person für diesen Arbeitsplatz identifiziert wird. 
Profitiert aus der Sicht der Befragten die Gesellschaft von der Datensammlung 
und -verwertung, wird auch die automatisierte Auswahl der geeignetsten Per- 
son durchaus begrüßt. Auf der anderen Seite sehen Personen, die sich vor allem 
individuelle Vorteile versprechen sowie den Wissensgewinn erwarten, diese auto- 
matisierte Auswahl kritisch. Über die Gründe hierfür kann jedoch an dieser Stelle 
nur spekuliert werden. Womöglich zeigt sich hier die Befürchtung, in einem Ver- 
fahren ohne menschliches Korrektiv dann doch persönliche Nachteile zu erfahren. 
Auch hier ist als Desiderat die Frage nach dem Einfluss der wahrgenommenen 
und gewünschten Entscheidungshoheit zwischen Mensch und Maschine in der 
Evaluation neuer KI-Anwendungen festzustellen. 

Geht es um die Kreditvergabe, zeigt sich, dass das BDGS allgemein bei 
zunehmender Ausprägung die Bedrohungswahrnehmung bei der Empfehlung und 
automatisierter Kreditvergabe mindert. Hier wird der Einsatz von datenbasier- 
ten KI-Anwendungen von den Befragten, die eine positive Erwartungshaltung 
gegenüber Datensammlung und -verwertung haben, entsprechend weniger kritisch 
gesehen. Die vermeintlichen Vorteile der automatisierten Kreditvergabe werden 
von diesen Personen also eher erwartet. 

Mit Blick auf die eher kleinen Effektstärken des Einflusses des BDGS und 
seiner Dimensionen überwiegen anscheinend jedoch andere Gründe, die dazu 
führen, KI-Anwendungen in den einzelnen Kontexten als eine Bedrohung zu 
empfinden. Hierzu mag beitragen, dass die gewählten Anwendungsbereiche für 
einen Teil der Befragten womöglich keine Relevanz besitzen — und dahingehend 
unabhängig von den Glaubenssätzen mit Bezug zu digitalen Daten sind. Wer 
keinen Kredit benötigt oder bereits im Rentenalter ist, der hat durch die KI- 
Anwendungen nichts zu befürchten. Oder aber die Konsequenzen sind bei einigen 
Befragten so weitreichend, dass die Reichweite der individuellen Konsequenzen 
hinter die allgemeinen Einstellungen des BDGS im vorliegenden Fall zurücktritt. 
In beiden Fällen wäre es notwendig, die individuelle Betroffenheit der Befragten 
zu kontrollieren, wobei keine Angaben zur persönlichen Betroffenheit erhoben 
wurden. Hier sei auch auf den speziellen Einfluss der Fairness-Wahrnehmung 
abgestellt, der womöglich einen zusätzlichen moderierenden Einfluss darstellt 
(Marcinkowski & Starke, 2019): Ein Verfahren muss nicht nur datenbasiert 
ablaufen, sondern dies muss auch dazu führen, dass die KI-Anwendung als ver- 
meintlich fairer wahrgenommen wird, was in zukünftigen Studien mithin geprüft 
werden sollte. 
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10.11 Ergebnisse der Erhebung 2.3 Krankenversicherung 


Die Hypothesen wurden mit Hilfe eines Strukturregressionsmodells in AMOS 
23 geprüft. Genauer wurde aufgrund der wiederholten Durchführung des Befra- 
gungsexperiments in den beiden Teilstudien eine MGKA durchgeführt. Dabei 
wurden die Manipulationen der Experimentalkonditionen sowie deren Interaktion 
als manifeste unabhängige Variablen (dummy-codiert)”> sowie die vier Mess- 
modelle der BDGS-Dimensionen Genauigkeit, Wissensgewinn sowie individueller 
Nutzen und gesellschaftlicher Nutzen als latente unabhängige Variablen modelliert 
(siehe Abbildung 10.3). Die UV haben im Modell als exogene Variablen einen 
direkten Einfluss auf die manifeste abhängige Variable der Wechselbereitschaft, 
die als einzige endogene Variable modelliert ist. 


10.11.1 Datenauswertung und Ergebnisse 


Prüfung der Messäquivalenz 

Bevor die Prüfung der Hypothesen durchgeführt werden kann, sollte zunächst 
die Messinvarianz des Gesamtmodells überprüft werden, also inwieweit sich die 
Beziehungsstruktur des Modells für die beiden Stichproben in Erhebung 2.3a 
Krankenversicherung und Erhebung 2.3b Krankenversicherung unterscheidet (van 
de Schoot et al., 2012; Weiber & Mühlhaus, 2014). Zum einen ist wichtig zu 
prüfen, ob die Messung der latenten Konstrukte des BDGS in beiden Stichproben 
messäquivalent ist. Nur bei Messäquivalenz kann davon ausgegangen werden, 
dass die latenten Faktoren das gleich Konstrukt messen und sinnvoll miteinan- 
der verglichen werden können (Widaman & Reise, 1997). Zum anderen kann mit 
Blick auf die Äquivalenzprüfung der Regressionsgewichte getestet werden, ob die 
Kausalzusammenhänge des Modells in beiden Stichproben identisch sind "7 Es 
gibt keine Annahme, die besagt, dass es hier bedingt durch die Stichprobenzusam- 
mensetzung (Studierende in Erhebung 2.3a Krankenversicherung und in Erhebung 
2.3b Krankenversicherung ein heterogenes Sample deutscher Internetnutzer) zu 


23 Manipulation Profit: 0 — ‚kein Profit‘ vs. 1 ‚Profit‘, Manipulation Notwendigkeit zur 
Datenabgabe: 0 ‚keine Datenabgabe erfordert‘ vs. 1 ‚Datenabgabe erforderlich‘ 


24 Hier ist zu beachten, dass im vorliegenden Modell lediglich eine Prüfung der Kausal- 
zusammenhänge von Interesse ist und keine Aussagen über unterschiedliche Mittelwerte 
der Konstrukte getroffen werden soll. Aufgrund der fehlenden Schätzung von Mittelwerten 
und Achsenabschnitten wird die Invarianz allein für die Kausalzusammenhänge im Modell 
geprüft. Es wird also lediglich auf den mittleren Grad der Messinvarianz abgestellt (Weiber & 
Miihlhaus, 2014). 
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Unterschieden kommen sollte, weshalb im Umkehrschluss geprüft wird, ob die 
vermutete Beziehungsstruktur in beiden Stichproben äquivalent ist. Geprüft wird 
also zunächst die konfigurale Messinvarianz und anschließend die metrische Mes- 
sinvarianz für die Parameterschätzungen der Regressionsgewichte der latenten 
Faktoren des BDGS. Für gewöhnlich ist an dieser Stelle dann zunächst noch die 
skalare Invarianz zu prüfen, also die Invarianz der Regressionskonstanten. Da 
im vorliegenden Modell jedoch keine Mittelwerte und Achsenabschnitte berech- 
net wurden, entfällt dieser Prüfschritt auf starke faktorielle Messinvarianz hier. 
Des Weiteren lässt sich dann noch die Invarianz der Kovarianzen der unabhängi- 
gen Variablen prüfen sowie die Invarianz der Messfehler. Letztendlich wird die 
Gleichheit der Pfadkoeffizienten des Strukturmodells geprüft, also, ob die model- 
lierten Zusammenhänge zwischen den UV und den AV in beiden Stichproben 
identisch sind. 

Die zu prüfenden Modelle wurden gemäß der Konfiguration in Abbildung 10.3 
spezifiziert und mit den entsprechenden Gleichheitsrestriktionen für die jeweilige 
Stufe der Messinvarianz versehen (Weiber & Mühlhaus, 2014). Der Modell- 
vergleich der geschätzten Modelle in Tabelle 10.20 zeigt, dass lediglich die 
Voraussetzung der Messfehlervarianz (strikte faktorielle Messinvarianz) nicht 
erfüllt ist, jedoch davon ausgegangen werden kann, dass konfigurale Invarianz 
sowie die Invarianz der Regressionsgewichte und Kovarianzen gegeben ist. Der 
Modellvergleich auf Grundlage eines Chi-Quadrat-Differenztests zwischen dem 
unrestringierten Modell MI und dem Modell М5 mit lediglich freigegebenen 
Messfehlervarianzen zeigt dann auch, dass die Restriktionen nicht signifikant zu 
einer Verschlechterung der Anpassungsgüte führen (AX? = 32.983, Adf = 39, p 
= .740). 

Daher wird mit Blick auf die nachfolgende Priifung der Hypothesen das 
Modell diskutiert, bei dem lediglich die Messfehler freigegeben sind, alle anderen 
Parameterschätzer jedoch restringiert sind. Die Annahmen des Modells sind also 
bis auf die frei variierenden Messfehler fiir beide Stichproben gleich. 
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Prüfung der Hypothesen 

Das geschätzte Modell der MGKA mit der Invarianz der Pfadkoeffizienten 
(Modell 5) zeigt eine zufriedenstellende Anpassungsgüte (siehe Tabelle 10.20). 
An dieser Stelle wurde nun aufgrund des Problems der hohen Multi-Kollinearität 
der BDGS-Faktoren ein weiteres Modell mit Gleichheitsrestriktionen geprüft, bei 
denen die Strukturgewichte der vier Dimensionen auf die Wechselbereitschaft 
identisch waren (Modell 6). Durch die Prüfung mittels Gleichheitsrestriktionen 
wird verdeutlicht, inwieweit die einzelnen Dimensionen gleiche oder unglei- 
che Effekte auf die abhängigen Variablen haben. Der Vergleich der Modelle 
mit Hilfe eines Chi-Quadrat-Differenztests zeigt, dass das Modell 6 mit diesen 
Gleichheitsrestriktionen keine signifikant schlechtere Anpassungsgüte gegen- 
über dem Modell 5 mit freigesetzten Strukturgewichten hat (AX? = 2.138, 
df = 3, p = .544) und dem Modell 6 daher der Vorzug gegeben wird (M6: 
Х2(199) = 238.038, р = .030; RMSEA = .018 [.006, .026]; TLI = .992). 
Die Parameterschätzungen der Pfadkoeffizienten im Modell 2 finden sich in 
Tabelle 10.21. 


Tabelle 10.21 Parameterschätzungen der Pfadkoeffizienten des BDGS auf die Wechselbe- 
reitschaft in den Erhebungen 2.3a und 2.3b Krankenversicherung 


Exogene Variablen | В (SE)? р В 
(UV) 
Erhebung 2.3a Erhebung 2.3b 
Laboruntersuchung | Online-Befragung 
Individueller Profit .270 (.102) .008 .129 .156 
(MI) 
Notwendigkeit der —.256 (.102) .012 —.123 —.147 
Datenabgabe (М2) 
Interaktion —.019 (.144) .893 |-.008 —.009 
Manipulationen 
(M1*M2) 
Genauigkeit .039 (.009)* <.001 049 056 
Wissensgewinn .039 (.009)* < .001 .035 .048 
Individueller Nutzen | .039 (.009)* < .001 .048 .060 
Gesellschaftlicher .039 (.009)# < .001 .041 .053 
Nutzen 


Notizen. Abhängige Variable (endogene Variable im Modell): Wechselbereitschaft; * identische 
Werte für beide Stichproben aufgrund von Gleichheitsrestriktionen der geschätzten Parameter. 
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Der Einfluss der Manipulationen auf die Wechselbereitschaft 

Der individuelle Profit hat einen signifikant positiven Einfluss auf die Wech- 
selbereitschaft in die digitale individualisierte Krankenversicherung. Sowohl in 
Erhebung 2.3a. (ß = .129) als auch in Erhebung 2.3b. (ß = .156) zeigt sich dies 
als kleiner positiver Effekt. Mit steigendem Profit erhöht sich auch die Wech- 
selbereitschaft. Die Notwendigkeit der persönlichen Datenpreisgabe hingegen hat 
einen signifikant negativen Einfluss auf die Wechselbereitschaft. Sowohl in Erhe- 
bung 2.3a (В = -.123) als auch in Erhebung 2.36 (В = -.147) zeigt sich dies 
als kleiner negativer Effekt. Müssen Daten preisgegeben werden, fällt die Wech- 
selbereitschaft geringer aus, als wenn keine Daten mit der Versicherung geteilt 
werden müssen. 


Der Einfluss der Dimensionen des BDGS auf die Wechselbereitschaft 

Das BDGS, abgebildet über die vier Dimensionen Genauigkeit (PErhebung 2.3a = 
:049; Erhebung 2.38 = -056), Wissensgewinn (Erhebung 23а = -035; Erhebung 2.3b 
= .048) sowie individueller Nutzen (BErhebung 23a = 048; BErhebung 23b = .060) 
und gesellschaftlicher Nutzen (BErhebung 23a = .041; PErhebung 2.35 = .053), zeigt 
einen signifikant kleinen positiven Effekt auf die Wechselbereitschaft. Allerdings 
bestehen mit Blick auf die Gleichheitsrestriktionen im Modell keine Unterschiede 
des Einflusses auf die Wechselbereitschaft zwischen den Dimensionen. Hypothese 
2.3 wird folglich angenommen. 


10.11.2 Diskussion der Ergebnisse von Erhebung 2.3 
Krankenversicherung 


Die Ergebnisse der experimentellen Untersuchungsanlage zeigen zunächst, dass 
es bei der Entscheidung über den Wechsel in einen auf digitaler Datengrundlage 
individualisierten Krankenversicherungstarif zu einer Kosten-Nutzen-Abwägung 
bei den Befragten kommt. Während der als Nutzen wahrgenommene mone- 
täre Vorteil sich positiv auf die Bereitschaft zum Wechsel auswirkt, führen 
mit dem Wechsel verbundene Kosten, wie im vorliegenden Fall die Preisgabe 
personenbezogener Daten, zu einer geringeren Wechselbereitschaft. 

Es zeigt sich, dass unter Berücksichtigung des Einflusses der Kosten-Nutzen- 
Abwägung die Ausprägung des BDGS insgesamt einen positiven Einfluss auf 
die Wechselbereitschaft hat. Das BDGS hat hier einen Einfluss auf eine konative 
Komponente der Einstellung. Personen mit hoher Ausprägung auf den Dimen- 
sionen des BDGS sind eher geneigt zu wechseln. Hier zeigt sich also an einem 
konkreten Beispiel der Digitalisierung des Gesundheitswesens, dass das BDGS 
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als Prädisposition verhaltenswirksame Konsequenzen haben kann, die unabhängig 
von unmittelbaren Vor- oder Nachteilen für das Individuum bestehen. 


10.12 Ergebnisse der Erhebung 2.4 КЇ und Hochschule 
10.12.1 Datenauswertung und Ergebnisse 


Um die aufgestellten Hypothesen 2.4a, 2.4b und 2.4c zu prüfen, wurde ein Struk- 
turregressionsmodell in AMOS 23 spezifiziert, wobei aufgrund einiger fehlender 
Werte eine FIML-Schätzung durchgeführt wird. Im Modell haben die vier BDGS- 
Dimensionen einen direkten Einfluss auf das Vertrauen in die Richtigkeit der 
KI-basierten Entscheidung sowie auf die Reputation der Hochschule und den 
vermeintlichen Protest gegen das KI-basierte Auswahlverfahren.” Es wird wei- 
terhin davon ausgegangen, dass das Vertrauen in die Richtigkeit einen Effekt auf 
die Reputation der Hochschule hat sowie auf das Protestverhalten gegen das Aus- 
wahlverfahren. Letztlich wird ein lediglich kovariater Zusammenhang zwischen 
der Reputation der Hochschule und dem Protestverhalten geprüft, in dem eine 
Korrelation zwischen den Fehlertermen der beiden latenten Faktoren modelliert 
wird (siehe Abbildung 10.4).26 

Ein geschätztes Modell ohne Identitätsrestriktionen (Modell 1) zeigt mit Blick 
auf den strengen Chi-Quadrat-Test eine unzureichende Anpassungsgüte (siehe 
Tabelle 10.22). Die inkrementellen Fit-Maße indizieren jedoch eine zufrieden- 
stellende Anpassungsgüte. Die nicht erklärte Varianz ist auch hier durch die 
Modellkomplexität und die Stichprobengröße bedingt, wobei sich zeigt, dass ins- 
besondere einige Indikatoren der abhängigen Variablen noch über den gemeinsam 
geteilten latenten Faktor hinaus kovariieren, was an dieser Stelle vernachlässigt 
wird. Anschließend wird nun ein weiteres Modell mit Gleichheitsrestriktionen 
für die Strukturgewichte der BDGS-Dimensionen auf die abhängigen Variablen 
geprüft (Modell 2). 


25 Während der Einfluss des BDGS aus das Vertrauen in die Richtigkeit der Entscheidung 
zur Hypothesenprüfung modelliert wird, werden die Pfade vom BDGS zur Reputation und 
zur Protestneigung zur Kontrollvariablenprüfung verwendet. Mithin wird von einer vollstän- 
digen Mediation des BDGS-Einflusses durch das Vertrauen in die Richtigkeit ausgegangen 
(Müller, 2007). 

26 Spezifiziert jedoch nicht in der Abbildung aufgeführt sind die Inter-Korrelationen der 


latenten exogenen Faktoren des BDGS. Zu den Werten der interdimensionalen Korrelationen 
siehe Abschnitt 10.7. 
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Durch die Prüfung mittels Gleichheitsrestriktionen wird verdeutlicht, inwie- 
weit die einzelnen Dimensionen des BDGS gleiche oder ungleiche Effekte auf 
die abhängigen Variablen haben, worauf auch die aufgeworfene Frage nach dem 
distinkten Einfluss der Dimension Genauigkeit abzielte (siehe Abschnitt 10.3.4). 
Der Vergleich der Modelle mit Hilfe eines Chi-Quadrat-Differenztests zeigt, dass 
das Modell 2 mit diesen Gleichheitsrestriktionen eine signifikant schlechtere 
Anpassungsgüte gegenüber dem Modell 1 mit freigesetzten Regressionsgewich- 
ten hat (AX? = 20.512, df = 9, p = .015). Modell 2 mit Gleichheitsrestriktionen 
ist daher abzulehnen. 

Es zeigt sich mit Blick auf die Effekte im Modell 1, dass sich teilweise unter- 
schiedliche Einflüsse der BDGS-Dimensionen manifestieren. Das Modell 2 wird 
entsprechend respezifiziert und auf Grundlage der Erkenntnisse aus Modell 1 wer- 
den einige restringierte Regressionsparameter wieder freigegeben. Dieses dritte 
Modell beinhaltete mithin eine vollständige Gleichheitsrestriktion der Einflüsse 
der BDGS-Dimensionen auf die Reputation der Hochschule sowie das Protestver- 
halten. Der Einfluss der BDGS-Dimensionen auf das Vertrauen in die Richtigkeit 
der Entscheidung hingegen reflektierte lediglich eine partielle Gleichheitsrestrik- 
tion (siehe Tabelle 10.22). Der Vergleich der Modelle zeigt, dass das Modell 2 
eine signifikant schlechtere Anpassungsgüte gegenüber dem Modell 3 hat (AX? 
= 11.422, df = 1, p = .001). Modell 3 hat jedoch keine signifikant schlechtere 
Anpassungsgüte als Modell 1 (AX? = 9.090, df = 8, р = .335). Modell 3 mit 
den partiellen Gleichheitsrestriktionen wird daher der Vorzug gegeben und die 
Parameterschätzungen dieses Modells nachfolgend berichtet. 

In Tabelle 10.23 finden sich die Informationen zu allen geschätzten Pfaden 
des Modells 3. Es zeigt sich, dass die Erwartungen an die Genauigkeit digitaler 
Daten im vorliegenden Anwendungsfall einen direkten Einfluss auf das Vertrauen 
in die Richtigkeit der KI-basierten Entscheidung hat. Je größer die Erwartung an 
die Genauigkeit von digitalen Daten, desto eher wird auf die Richtigkeit der KI- 
basierten Entscheidung vertraut (В = .391). Die übrigen Dimensionen des BDGS 
haben hier keinen signifikanten Einfluss. Hypothese 2.4a wird daher dahingehend 
angenommen, dass es hier vor allem die Überzeugungen von der Genauigkeit 
digitaler Daten sind, die im Rahmen des BDGS ein Vertrauen in die Richtigkeit 
der KI-basierten Auswahlentscheidung positiv beeinflussen. 
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Tabelle 10.23 Parameterschätzungen der Pfadkoeffizienten in Erhebung 2.4 KI und Hoch- 
schule 


Unabhängige Variablen 
(UV) 


Endogene Variable (AV) | В (SE) р В 


Genauigkeit Vertrauen in die .504 (.112) <.001 .391 
Wissensgewinn Richtigkeit der | .032 (.039)? 410 ‚020 
Auswahlentscheidung - 

Individueller Nutzen .032 (.039) è 410 ‚029 
Gesellschaftlicher .032 (.039) è 410 ‚025 
Nutzen 

Genauigkeit Reputation der .027 (.011)° .015 .035 
Wissensgewinn Hochschule .027 (.011)° .015 | .028 
Individueller Nutzen .027 (.011)° .015 .042 
Gesellschaftlicher .027 (.011)° .015 .036 
Nutzen 


Vertrauen in die .406 (.031) < .001 ‚685 


Richtigkeit der 

Auswahlentscheidung 

Genauigkeit Protest gegen die —.022 (.015)° .138 | -.025 

Wissensgewinn Ki-basierte ` ` —.022 (.015)° .138 |—020 
Auswahlentscheidung 

Individueller Nutzen —.022 (.015)° .138 —.030 

Gesellschaftlicher —.022 (.015)° .138 —.026 

Nutzen 


Vertrauen in die —.334 (.040) < .001 —.519 
Richtigkeit der 


Auswahlentscheidung 


Notizen. +° Werte der Regressionskonstanten mit gleichen Buchstaben wurden mit 
Gleichheitsrestriktionen der Strukturgewichte spezifiziert und haben daher identische 
Parameterschätzungen. 


Der direkte Effekt des BDGS auf die eingeschätzte Reputation der Hochschule 
zeigt einen kleinen signifikanten positiven Effekt (В = .027, SE = .011, p = 
.015), der jedoch als gering zu bewerten ist (BGenauigkeit = -035; Bwissensgewinn 
= .028; Pindividueller_ Nutzen = .042; BGesellschaftlicher_Nutzen = -036). Es zeigt sich 
zudem, dass das Vertrauen in die Richtigkeit der Entscheidung zu einer höheren 
Reputation der Hochschule bei den Befragten führt (ß = .685). Der starke gesamte 
Effekt der Dimension Genauigkeit auf die Reputation der Hochschule (ß = .303) 
wird daher zum Großteil durch den indirekten Effekt (В = .268) der Genauigkeit 
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über das Vertrauen in die Richtigkeit der Auswahlentscheidung erklärt. Hypothese 
2.4b wird dahingehend angenommen, dass auch hier das BDGS einen positiven 
Einfluss auf die Reputation der Hochschule hat, in diesem Rahmen jedoch ins- 
besondere die Überzeugungen von der Genauigkeit der Daten ausschlaggebend 
sind. 

Die Effekte auf die Bereitschaft gegen die Entscheidung zu protestieren sind im 
Vergleich insgesamt kleiner. So ist auch der direkte Effekt des BDGS kleiner und 
nicht signifikant (B = -.022, SE = .015, p = .138). Allerdings zeigt sich auch 
hier, dass das Vertrauen in die Richtigkeit der Entscheidung erneut einen direkten 
Einfluss hat (В = -.519).27 Der starke gesamte Effekt der Dimension Genau- 
igkeit auf die Reputation der Hochschule (ß = -.228) wird daher zum Großteil 
durch den indirekten Effekt (В = —.174) der Genauigkeit über das Vertrauen in 
die Richtigkeit der Auswahlentscheidung erklärt. Hypothese 2.4c wird auch hier 
dahingehend angenommen, dass das BDGS einen negativen Einfluss auf die Pro- 
testneigung hat, in diesem Rahmen jedoch insbesondere die Überzeugungen von 
der Genauigkeit der Daten ausschlaggebend sind. 


10.12.2 Diskussion der Ergebnisse von Erhebung 2.4 KI und 
Hochschule 


Die Ergebnisse zeigen, dass die Erwartungen an die Genauigkeit digitaler Daten 
einen hohen Einfluss auf das Vertrauen in die Richtigkeit der durch die KI 
getroffenen Auswahlentscheidung haben und somit vor allem indirekt auch die 
Reputationsbewertung der Hochschule beeinflussen, die ein solches Verfahren 
einsetzt, und auch die Neigung zum Protest gegen die getroffene Entscheidung. 
Studierende, die also ein objektives und genaues Verständnis der Wirklichkeit 
erwarten, zeigen sich eher von der Richtigkeit der getroffenen Auswahlentschei- 
dung einer KI-Anwendung im Rahmen des Zulassungsverfahrens überzeugt. Es 
ist also folglich nicht jede Einzelne der Dimensionen des BDGS, die im Erkennt- 
niszusammenhang einen Einfluss zeitigt, sondern im vorliegenden Fall diejenige, 
die als überaus relevant für das benötigte Vertrauen in die KI-Anwendung ein- 
gestuft werden kann: Liegen digitale Daten vor, die ihrem Wesen nach ein 
objektives und exaktes Verständnis der Welt ermöglichen, wird vertraut, dass 
eine KI-Anwendung zur Hochschulzulassung auf Grundlage dieser Daten auch 


27 Die Fehlerterme der beiden letztgenannten Variablen weisen eine mittlere negative Korre- 
lation auf (т = —.318). 
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die richtige Entscheidung trifft. In den Augen von Studierenden, die auf die Rich- 
tigkeit der Auswahlentscheidung vertrauen, genießt die Hochschule eine höhere 
Reputation. Gleichzeitig sinkt die Protestbereitschaft, wenn erwartet wird, dass 
die KI-Anwendungen richtige Entscheidungen produziert. Im Umkehrschluss 
könnte sich also hier eher einer Entscheidung gefügt werden, wenn der Prozess 
ihres Zustandekommens als korrekt empfunden wird. 

Es zeigt sich mithin die Bedeutung der individuellen Erwartungen an digitale 
Datenbestände, die im vorliegenden Fall der Hochschulzulassung ein Prädiktor 
für das entgegengebrachte Vertrauen und die Reaktion der Studierenden auf die 
Einführung von KI-Anwendungen zur Hochschulzulassung ist. Es ist auch aus 
diesem Grund aus Sicht der Beteiligten ein Verständnis für das Wesen der digi- 
talen Daten bei den am Verfahren beteiligten (zukünftigen) Studierenden und 
den Verantwortlichen auf Seiten der Hochschule herzustellen. Fragen nach der 
Art und Qualität der Daten sollten weitgehend transparent und nachvollziehbar 
erörtert werden, um sicherzustellen, dass auf der einen Seite keine überzoge- 
nen Erwartungen an das KI-Verfahren gestellt werden und vermieden wird, dass 
ein ausgeprägter Glaube an die digitalen Daten einen Missbrauch der Systeme 
provoziert. Auf der anderen Seite können durch diese Transparenz bei den eher 
datenskeptischen Studienbewerber*innen negative Reaktionen und ein Misstrauen 
vermieden werden. Dabei sollte weitere Forschung die Reichweite gebotener 
und notwendiger Entscheidungsbegründungen analysieren, da es Hinweise darauf 
gibt, dass vollständige Transparenz weder umsetzbar noch zielführend erscheint 
(Fine Licht & Fine Licht, 2020). 
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In der vorliegenden Arbeit ging es darum, mit Hilfe des Werkzeugkastens empi- 
rischer Sozialforschung ein Wahrnehmungsmuster sichtbar zu machen, das einen 
Erklärungsbeitrag dazu leisten kann, wie Menschen auf das Aufkommen neuer 
Techniken der Mustererkennung in digitalen Daten im Zuge der Digitalisierung 
reagieren. Konkret wurde hinsichtlich der technischen Innovationen, die mit KI- 
Anwendungen in vielen Lebensbereichen derzeit und in naher Zukunft auch in 
Deutschland eingeführt werden, untersucht, wie Bürger*innen der Einführung 
dieser neuen datenverarbeitenden, mustererkennenden Systeme begegnen. Da mit 
Blick auf die eigene Datenverwertung wenige oder gar keine Primärerfahrungen 
der Bürger*innen vorliegen, wurde davon ausgegangen, dass ausgehend von den 
öffentlichen Diskursen über Digitalisierung und verwandter Phänomene vor dem 
Hintergrund der Informations- und Wissensgesellschaft eine allgemeine Erwar- 
tungshaltung vermittelt wird, mit der auf die gesellschaftlich weit verbreitete 
Datensammlung und -verwertung reagiert wird. Diese als Glaube charakteri- 
sierte Erwartungshaltung speist sich aus individuell nicht hinreichend prüfbaren 
gesellschaftlich kommunizierten Erzählungen über Digitalisierungsphänomene 
allgemeiner Art und digitale Daten unter dem Stichwort Big Data im Speziel- 
len. Dabei werden insbesondere miteinander zusammenhängende Überzeugungen 
bezüglich der Erkenntnis- und Nutzengewinne aus großen digitalen Datenbe- 
ständen vermittelt. Die hieraus gewonnenen Überzeugungen und ihr jeweiliger 
Überzeugungsgrad, die eben kein Wissen sind, sich jedoch u. a. auch auf Wis- 
sen beziehen, können individuell unterschiedlich ausgeprägt sein. Sie sind in 
der Gesamtschau jedoch als generell stabiles gesellschaftliches Wahrnehmungs- 
muster festzustellen. Dabei zeigt die vorliegende Arbeit auf innovativem Wege, 
wie sich auf digitale Daten beziehende Kognitionen, die in Theorie und For- 
schung häufig beschrieben und als existent vorausgesetzt werden, empirisch als 
Beobachtungsvariablen erheben und analysieren lassen. Mithin ist der skizzierte 
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Glaube an das Potential und die Wirkmächtigkeit digitaler Daten kein blinder 
Glauben. Es wurde weder der Vorwurf formuliert noch hat es sich gezeigt, 
dass datenbezogene Glaubenssätze allgemein unhinterfragt übernommen werden. 
Gerade die Variabilität möglicher Überzeugungen bezüglich digitaler Daten und 
des Verhältnisses der Überzeugungen untereinander sollte mit einem kovarianz- 
basierten Ansatz standardisierter Messung abgebildet werden und ein solches 
Messverfahren konnte erfolgreich eingesetzt werden. 

Das zunächst auf Grundlage der Literatur herausgearbeitete Glaubenssys- 
tem zu Big Data fokussierte im Rahmen der Untersuchung vier miteinander 
in Beziehung stehende Überzeugungen, die auch als Dimensionen des BDGS 
bezeichnet werden. Es wurde eine Messung durch Selbstauskunft im Sinne stan- 
dardisierter Befragungsforschung vorgeschlagen, um belastbare Aussagen über 
die vermuteten Zusammenhänge der Dimensionen untereinander und die allge- 
meine Ausprägung des Glaubens an Big Data tätigen zu können sowie eine 
Analyse der gesellschaftlichen Konsequenzen dieses Wahrnehmungsmusters vor- 
zubereiten. Im Rahmen der Messung wurden dann Glaubenssätze abgefragt, 
die zentrale Elemente der an Big Data formulierten Erwartungen betrafen. Es 
ging hier um die Genauigkeit der digitalen Daten, den aus ihnen gezogenen 
Wissensgewinn und den erhofften Nutzen für das Selbst und die Gesellschaft. 

Bevor auf die Ausprägung dieser Dimensionen des BDGS und auf etwaige 
hieraus entstehende Konsequenzen eingegangen wird, muss jedoch zunächst zur 
Einordnung des Resümees eine Frage beantwortet werden, die quer zur Argumen- 
tationslinie und dem Vorgehen der Konzeption und Durchführung der Forschung 
liegt: Ist der Autor der vorliegenden Arbeit selbst von den eigens hierfür gewon- 
nenen Daten und das hierdurch generierte Wissen über das Konzept des BDGS 
überzeugt? Wie in den vorangegangenen Abschnitten deutlich wurde, sind die 
Bedingungen reliabler und valider empirischer Sozialforschung und die hier- 
für zur Verfügung stehenden Werkzeuge durchaus voraussetzungsreich. Nicht 
immer kommt man daher an die gewünschte Qualität der Messung und der Daten 
heran, was mit Blick auf die Limitationen der Beschaffenheit der Messung, der 
Stichproben und der daraus resultierenden Daten sowie Kausalitätsfragen an den 
entsprechenden Stellen diskutiert wurde. Der Einsatz des Befragungsinstruments 
hat jedoch deutlich gemacht, dass dort, wo Menschen zu den Glaubenssätzen des 
BDGS befragt wurden, eine Verortung des individuellen Zustimmungsgrads zu 
den formulierten Aussagen erfolgte, und ein überwiegender Teil der Befragten 
bereitwillig eine persönliche Einschätzung vornahm. Die Messung hat sich im 
Forschungsfeld erfolgreich einsetzen lassen und ermöglicht erste weiterführende 
Erkenntnisse über die Beschaffenheit und Ausprägung des konzipierten Glaubens 
an digitale Daten, die sogleich diskutiert werden. Die vorliegende Konzeption des 
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BDGS und seiner Messung muss sich dann jedoch im weiteren Einsatz in der For- 
schung bewähren und sich dabei fortwährend an der Erklärungskraft im Rahmen 
von Theoriebildung und -prüfung messen lassen. In diesem Rahmen stellen sich 
daher aktuelle weiterführende Forschungsfragen, die anschließend aufgeworfen 
werden. 


11.1 Zusammenfassung der Studienergebnisse 


Die vorgeschlagene Messung zum Glauben an das Wesen und die Konsequenzen 
digitaler Daten wurde mit drei Erhebungen in einer Studie zur Skalenkonstruktion 
entwickelt, die zugrunde liegende dimensionale Strukturspezifikation der Über- 
zeugungen wurde getestet und validiert. Die Messung fand im Rahmen einer 
weiteren Studie in vier Datenerhebungen Anwendung, wobei zunächst erneut auf 
die Ausprägung und Zusammenhänge der Dimensionen untereinander abgestellt 
wurde. Über beide Studien hinweg zeigt sich, dass die einzelnen Dimensionen 
des BDGS je nach Erhebung teilweise zwar unterschiedlich stark ausgeprägt sind, 
das BDGS sich jedoch im Verhältnis der Überzeugungen zueinander insgesamt 
als stabiles Wahrnehmungsmuster feststellen lässt. Während die Glaubenssätze 
in Bezug auf die Genauigkeit der Daten sowie des individuellen und gesell- 
schaftlichen Nutzens im Aggregat dabei eher differenziert betrachtet werden und 
abgewogene Zustimmung erfahren, erwarten die Befragten über alle Studienkon- 
texte hinweg einen großen Wissensgewinn aus Datensammlung und -auswertung. 
In allen vorgestellten Studien findet sich, dass die Erwartung, dass aus den Daten 
Wissen gewonnen werden kann, im Vergleich zu den anderen Erwartungen am 
stärksten ausgeprägt ist. Hieran zeigt sich die deutliche Überzeugung von einem 
der zentralen Elemente des Verwertungszusammenhangs digitaler Daten, welche 
vor dem Hintergrund der gesellschaftlichen Erzählung zur Wissensgesellschaft zu 
bewerten ist. Es wurde hierzu eine hohe Zustimmung angenommen, fußt doch der 
Mythos Big Data insbesondere auf dem zugeschriebenen Wissensgewinn, wenn 
er besagt, dass Big Data und ihre Auswertung eine Form besonderen Wissens 
ermöglichen, das zuvor unmöglich zu realisierende wahre, objektive und präzise 
Erkenntnis verspricht (boyd & Crawford, 2012). Die hinsichtlich dieser Ver- 
mutung ausgeprägter gesellschaftlicher Überzeugungen an den Wissensgewinn 
aufgestellte und geprüfte Hypothese fand empirisch wiederholte Bestätigung. 
Die Übernahme von Überzeugungen aus diesem öffentlich geführten Diskurs 
über digitale Daten war daher nicht nur Anlass dafür aufzuzeigen, welche Vor- 
stellungen, ausgehend von der primär wissenschaftlichen Beschäftigung bezüglich 
digitaler Daten, von großen digitalen Datenbeständen überhaupt bestehen können. 
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Sondern es stand dahingehend auch zu vermuten, dass die in einem gemeinsa- 
men Zusammenhang besprochenen Vorstellungen in der Konsequenz miteinander 
zusammenhängen und aktiviert werden. Dies ist insbesondere vor dem Hin- 
tergrund zu sehen, dass die wenigsten Menschen tatsächlich weitreichenden 
Kontakt mit den als Big Data bezeichneten großen digitalen Datenbeständen 
und den diesbezüglichen Möglichkeiten der datenanalytischen Wissensgenerie- 
rung haben dürften. Zwar bestehen durchaus vielerlei Primärerfahrungen mit 
digitalen Techniken, die zu Datenproduktion und -speicherung führen. Man sieht 
bei deren Nutzung auch vereinzelt die Ergebnisse und Konsequenzen der Daten- 
verwertung. Einen direkten und umfassenden Einblick in die datenanalytischen 
Hintergründe und ihre gesellschaftlichen Konsequenzen sowie Auswirkungen 
auf das Selbst haben, wenn überhaupt, jedoch nur sehr wenige Personen. Es 
wurde die Erwartung formuliert, dass sich in diesem Zusammenhang bezüglich 
der Überzeugungen von der analytischen Bedeutung von Big Data für Wissen 
und Verstehen gerade an einem sozio-technischen wissenschaftlichen Verständnis 
orientiert wird, das eingangs herausgearbeitet wurde. Auch die nun hierzu auf- 
gestellte Hypothese, dass vor diesem Hintergrund kommunikativ verbreiteter und 
übernommener Überzeugungen von Big Data auch die Dimensionen des BDGS 
in einem starken Zusammenhang miteinander stehen sollten, fand sich über alle 
Studien hinweg empirisch bestätigt. 

Dabei ist mit Blick auf die Daten immer wieder mehr als fragwürdig, ob diese 
Anspruch auf Objektivität besitzen und welchen Einfluss subjektive menschliche 
Entscheidungen auf ihren Entstehungs- und Verwertungskontext haben, ob sie 
also weitgehend verzerrungs- und fehlerfrei gespeichert werden und wie genau 
sie immerhin schon fragliche Realität tatsächlich abbilden können. Diese Pro- 
blematik wurde in dieser Arbeit eingangs aufgegriffen und schlägt sich auch in 
der unterschiedlich eingeschätzten Bewertung der Genauigkeit digitaler Daten in 
der Bevölkerung nieder. Nun mag man einwenden, dass trotz Zweifel an der 
Genauigkeit durchaus viel Wissen in den Daten steckt, es sich mit diesem Wis- 
sen jedoch wie mit der Spreu und dem Weizen verhält, die man voneinander 
trennen müsse. Deshalb kann der allgemeine Wissensgewinn trotz vielerlei Zwei- 
fel an der Qualität der Daten dennoch durchaus hoch sein und wird von den 
Befragten entsprechend hoch eingeschätzt. Die persönlichen und die gesellschaft- 
lichen Nutzenerwartungen werden hingegen über alle Studien hinweg durchweg 
variabler bewertet als die Erwartungshaltung mit Bezug auf den Wissensgewinn. 
Es gibt also durchaus auch Personen, die eine geringere Zustimmung zu den 
Aussagen aufzeigen und nicht unbedingt individuelle Vorteile und gesellschaftli- 
chen Nutzen mit dem Entstehungs- und Verwertungskontext der digitalen Daten 
in Verbindung setzen. Dabei zeigen allerdings hohe Korrelationen zwischen dem 


11.1 Zusammenfassung der Studienergebnisse 277 


persönlichen und dem gesellschaftlichen Nutzen sowie auch dem Wissensgewinn 
und der Genauigkeit der Daten, dass hier über alle Befragten hinweg ein aus- 
geprägter Zusammenhang zwischen den Einschätzungen vorliegt. Erwarten die 
Befragten einen zu hebenden Wissensschatz in und aus den digitalen Daten, 
geht das einher mit der allgemein zu Big Data formulierten Erwartung, dass die 
Gesellschaft von der Sammlung und Auswertung digitaler Daten profitiert, sowie 
wiederum mit Erwartungen an positive Konsequenzen für das Selbst. Wenn die 
Datensammlung und -auswertung schlecht für einen persönlich ist, dann beurteilt 
man auch die Folgen für die Allgemeinheit eher negativ. Umgekehrt bedeutet das, 
dass persönliche Vorteile weitgehend im Lichte gesellschaftlicher Nutzeneffekte 
gesehen werden — ‚alle profitieren, mich eingeschlossen‘ oder ‚alle profitieren, 
dann ich sicher auch‘. 

Dabei wurde jedoch eingangs darauf hingewiesen, dass der realisierte Wissens- 
gewinn insbesondere auf Seiten derjenigen liegt, die einen tatsächlichen Zugriff 
auf die digitalen Daten haben und über die Mittel und Wege verfügen, ver- 
meintliche Wissensschätze letztendlich zu heben. Das sind in den wenigsten 
Fällen die Bürger*innen selbst oder zumindest Akteur*innen und Institutionen 
der Zivilgesellschaft, sondern vor allem staatliche Akteur*innen und Unterneh- 
men, insbesondere solche aus dem Ausland. Dies ist dahingehend von besonderer 
Bedeutung, als dass durchaus die Möglichkeit besteht, dass das Individuum gra- 
vierende Nachteile durch Big Data erfährt, die Gesellschaft insgesamt jedoch in 
großem Maße profitiert. Das ist bspw. mit Blick auf die Ökonomie immer dort 
der Fall, wo menschliche Einflussnahme durch Computer und Roboter ersetzt 
wird, Profit und Effizienzgewinne realisiert werden, Preise sinken, die Qualität 
von Produkten und Dienstleistungen zunimmt, doch der Mensch seinen Arbeits- 
platz verliert oder sein ganzer Berufszweig und seine gelernten Fähigkeiten nicht 
mehr benötigt werden. Es ist zwar nicht so, dass diese Einschätzung immer zwin- 
gend bei allen Befragten eintreten muss. Im Mittel zeigt sich jedoch zusammen 
mit dem ausgeprägten erwarteten Wissensgewinn ein extrem hohes gleichzeiti- 
ges Auftreten beider Glaubensüberzeugungen des Nutzens. Beide sind so stark 
miteinander verbunden, dass zumindest aus empirischer Sicht in einzelnen Stu- 
dien oft nicht zwischen beiden Dimensionen unterschieden werden konnte. Dieses 
Ergebnis kann selbstverständlich bedingt sein durch das Abstraktionsniveau der 
Fragebatterie, das Digitalisierung und digitale Daten ganz allgemein betraf. Auf 
den konkreten Anwendungsfall heruntergebrochen, ist zu erwarten, dass bspw. ein 
Lagerist, dessen Arbeitsplatz in einem Logistiklager womöglich bald durch einen 
Roboter übernommen wird, durch den eigenen Arbeitsplatzverlust einen weit- 
reichenden persönlichen Nachteil erleidet. Wenn jedoch gleichzeitig durch den 
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Wegfall von menschlichen Arbeitsplätzen Vorteile wie Produktivitätsgewinne ent- 
stehen oder weniger Arbeitsunfälle geschehen, mag dies gesamtgesellschaftlich 
positiv bewertet werden. Diese Rechnung ist ganz allgemein und insbesondere 
durch einzelne Befragte nur schwer zu machen und dazu noch mit viel Unsi- 
cherheit behaftet. Daher verwundert umso mehr, dass die Befragten so sicher 
in ihren Überzeugungen sind, dass Vor- und Nachteile aus der Digitalisierung 
für sie selbst und für die Allgemeinheit in einem engen Verhältnis stehen. Hier 
schließen weiterführende Fragen danach an, inwieweit individuelle Perzeptionen 
und Eigenschaften sowie vor allem persönliche Erfahrungen einen Einfluss auf 
diese weit verbreiteten Überzeugungshaltungen nehmen können. Das gilt insbe- 
sondere für Situationen, in denen die Überzeugungen und hieraus resultierende 
Erwartungen enttäuscht werden. 


Der Einfluss des BDGS auf kognitive, affektive und konative Komponenten der 
Einstellung 

Es wurde dann eine zweite Studie durchgeführt, um zu ergründen, ob die 
Annahme Bestätigung findet, dass die Glaubensüberzeugungen, deren Existenz 
und Wirkung in der Literatur immer schon vorausgesetzt werden, auch als tatsäch- 
lich gemessene Konstrukte die angenommene Erklärungskraft im Zusammenhang 
mit datenbasierten digitalen Anwendungen haben. Dabei wurde wiederholt eben 
jene Vermutung geprüft, dass generelle Überzeugungen von der Realisierung 
eines Erkenntnis- und Nutzengewinns durch digitale Daten situativ aktiviert 
werden und aufzurufende oder gar erst zu bildende kognitive, affektive sowie 
konative Komponenten der Einstellung positiv beeinflussen. 

Dabei haben alle Erhebungen der Studie 2 gemein, dass es um den Umgang 
der Bürger*innen mit innovativen Anwendungen der КЇ in unterschiedlichen 
Anwendungsfeldern und Lebensbereichen geht, denen derzeit eine hohe Auf- 
merksamkeit zukommt und die besondere Ansprüche an Qualität und Preisgabe 
digitaler Daten stellen. In den einzelnen Erhebungen zeigte sich dabei konkret, 
dass BDGS bzw. einzelne relevante Dimensionen durchaus einen Einfluss auf 
kognitive, affektive sowie konative Komponenten der Einstellung haben können, 
und die diesbezüglich aufgestellte Hypothese fand sich empirisch weitgehend 
bestätigt. 

In der Erhebung 2.1 EU und KI wurden dabei als kognitive Komponente 
der Einstellung die Legitimitätswahrnehmungen unterschiedlich weitreichender 
Verfahren algorithmischer Entscheidungsfindung am Beispiel einer auf Daten 
basierenden Aufstellung des EU-Budgets durch Computerverfahren erfragt. Dabei 
fand sich ein Szenario, in dem eine KI-Anwendung allein und automatisiert 
auf Datengrundlage eine Entscheidung trifft, was ein Verfahren des Algorithmic 
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Decision-Making (ADM) abbildete. In einem weiteren hybriden Szenario musste 
die Aufstellung des EU-Haushalts noch von der Politik abgesegnet werden. Es 
wurde vermutet, dass Personen mit ausgeprägterem BDGS diesem Verfahren eine 
höhere Legitimität zusprechen. Dabei fand sich für etliche Dimensionen der Legi- 
timitätswahrnehmung in den beiden Szenarien eine empirische Bestätigung der 
Hypothese, da sich ein positiver Einfluss des BDGS zeigt. Je ausgeprägter bspw. 
die Glaubensüberzeugungen bezüglich des Erkenntnis- und Nutzengewinns aus 
digitalen Daten sind, desto positiver sind auch jeweils die wahrgenommene Legi- 
timität des Prozesses und die erwartete Erreichung der aufgestellten Ziele in 
beiden Szenarien. 

In Erhebung 2.2 KI-Bedrohung wurden weiterhin erwartete Einflüsse des 
BDGS auf eine affektive Komponente der Einstellung geprüft. Konkret wurde 
untersucht, ob ein ausgeprägtes BDGS einen negativen Einfluss auf die Bedro- 
hungswahrnehmung von KI-Anwendungen hat, die auf Datengrundlage Ent- 
scheidungsempfehlungen aussprechen oder im Rahmen von ADM gar selbst 
Entscheidungen treffen. Die geprüfte Hypothese ging hier davon aus, dass aus- 
geprägte Glaubensüberzeugungen bezüglich der großen digitalen Datenbestände 
dazu führen, dass der Einsatz solch datenverarbeitender KI in unterschiedlichen 
Anwendungsfeldern als weniger bedrohlich empfunden wird. Es zeigte sich, dass 
auch hier einzelne Kognitionen des BDGS unterschiedliche Einflüsse zeitigen, 
sich die Hypothese jedoch weitgehend empirisch bestätigt fand. So gab es durch- 
aus Unterschiede zwischen den Einflüssen der Kognitionen des BDGS je nach 
Funktion der KI sowie den jeweiligen Anwendungsbereichen. Mit Blick auf bloße 
Entscheidungsempfehlungen durch KI führte das BDGS bzw. einzelne Dimen- 
sionen des BDGS zu einer geringeren Bedrohungswahrnehmung, wenn es um 
medizinische Behandlungen, Personaleinstellungen oder die Kreditvergabe ging. 
Ging es um automatisiert getroffene Entscheidungen durch ADM, so führte das 
BDGS bzw. einzelne Dimensionen im Rahmen der medizinischen Behandlung 
und Kreditvergabe zu einer geringeren Bedrohungswahrnehmung. Lediglich mit 
Blick auf die automatisierte Personaleinstellung gab es mitunter gegenläufige 
Effekte der Glaubensüberzeugungen. Mögliche Gründe für dieses Ergebnis und 
Fragen nach dessen Belastbarkeit sollten im Rahmen von Anschlussforschungen 
weitere Beachtung finden. 

Die Erhebung 2.3 Krankenversicherung fokussierte dann eine konative Kom- 
ponente der Einstellung. In dieser Erhebung wurden Probanden dabei in einem 
experimentellen Design mit einem datenbasierten Krankenversicherungsmodell 
konfrontiert, wobei neben den manipulierten Einflüssen des persönlichen Spar- 
potentials sowie der Notwendigkeit der Datenpreisgabe auch der Einfluss des 
BDGS auf die Verhaltensintentionen der Wechselbereitschaft in ein datenbasiertes 
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Versicherungsmodell untersucht wurde. Es wurde vermutet, dass ein ausgepräg- 
tes BDGS neben der Kosten-Nutzen-Abwägung persönlich gesehener Vor- und 
Nachteile die Wechselbereitschaft begünstigt, da hier generelle Vorteile einer 
umfassenden Sammlung und Auswertung von Gesundheitsdaten gesehen werden. 
Die entsprechend aufgestellte und geprüfte Hypothese fand Bestätigung, denn es 
zeigt sich, dass ein ausgeprägter Glaube an digitale Daten die Bereitschaft erhöht, 
in einen auf Grundlage von Individualdaten berechneten Versicherungstarif zu 
wechseln. 

Abschließend ging es in der Erhebung 2.4 KI und Hochschule um ein 
KI-gestütztes Studienzulassungsverfahren und dessen Einschätzungen durch Stu- 
dierende. Hier wurde nicht nur vermutet, dass Studierende mit ausgeprägtem 
BDGS ein stärkeres Vertrauen in die Richtigkeit auf Grundlage von Daten 
getroffener Entscheidungen der Studienplatzvergabe zeigen. Es wurde auch 
erwartet, dass hiervon Reputationseinschätzungen der Hochschule, die eine solche 
KI-Anwendung zur Zulassungsentscheidung einsetzt, und die mögliche Protest- 
bereitschaft gegen dieses Verfahren abhängen, da bei ausgeprägter Überzeugung 
an die Potentiale digitaler Daten die generellen Vorteile datenbasierter Com- 
puterverfahren übergewichtet werden. Es wurde mithin erneut ein Einfluss des 
BDGS auf kognitive sowie konative Komponenten der Einstellung geprüft. Hier- 
bei ist zu berücksichtigen, dass es insbesondere Studierende sind, für die sich 
in den vorliegenden Erhebungen ein im Vergleich hoch ausgeprägtes BDGS 
beobachten ließ. Auch hier fand die aufgestellte Hypothese empirische Bestä- 
tigung, da sich zeigt, dass es insbesondere die Glaubensüberzeugungen bezüglich 
der Exaktheit und Objektivität digitaler Daten sind, von denen das Vertrauen 
in die Richtigkeit datenbasierter Entscheidungen abhängt. Nicht nur, dass sich 
hier spezielle Einflüsse einzelner Überzeugungen feststellen lassen. Es zeigen 
sich neben den direkten Effekten des BDGS auf die eingeschätzte Reputation 
und Protestbereitschaft vor allem auch indirekte Effekte auf Einstellungen und 
Verhaltensintentionen durch Kognitionen des BDGS. 

Die Befunde zeigen also nicht nur, dass sich die BDGS-Skala reliabel und 
erfolgreich zur Messung in unterschiedlichen Forschungszusammenhängen ein- 
setzen lässt und Erkenntnisse bezüglich der Ausprägung einzelner Glaubensüber- 
zeugungen erlaubt. Sie besitzt unter der Annahme eines stabilen Glaubensmusters 
dann weiterhin auch Einflüsse auf situativ aufzurufende Kognitionen, wenn Per- 
sonen auf neue Anwendungen der datenverarbeitenden, mustererkennenden KI in 
unterschiedlichen Anwendungsfeldern und Lebensbereichen treffen. 
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11.2 Erkenntnisse und Anschlussfragen 


Je nachdem aus welcher Perspektive man die vorliegenden Erkenntnisse zum 
Glauben an die digitalen Daten betrachtet, ergeben sich nun unterschiedliche 
Schlussfolgerungen und Frageschwerpunkte für eine anschließende Beschäfti- 
gung mit gesellschaftlichen Fragen zur Digitalisierung und der Quantifizierung 
des Sozialen. 


Erkenntnisse und Anschlussfragen aus Sicht der Zivilgesellschaft 

Insbesondere die Zivilgesellschaft sollte dabei eine Erwartungshaltung an die 
Potentiale und Wirkmächtigkeit von IuK sowie der Sammlung und Auswertung 
digitaler Daten bedenken und hinterfragen. Diese Arbeit, die auch vor dem Ein- 
druck einer seit dem Frühjahr 2020 andauernden gesellschaftlichen Krisenlage 
der weltweiten COVID-19-Pandemie entstanden ist, attestiert einen weit verbrei- 
teten Glauben an den Erkenntnis- und Nutzengewinn aus den digitalen Daten. 
Die aktuelle Krisensituation hat dabei allerdings vor Augen geführt, dass auch 
der technische Fortschritt die Gesellschaft nicht ausreichend vor dem Herein- 
brechen des Ausnahmezustands schützen, geschweige denn vor der Wucht der 
Veränderung warnen oder auf diese vorbereiten konnte. Die Vorhersagefähig- 
keiten datenbasierter Prognosemodelle versagten oder kamen schnell an ihre 
Grenzen. Die Bedeutung dieser Daten wird nun auch immer wieder zur Bewäl- 
tigung der Krisensituation hervorgehoben, hat aber zumindest ihr Aufkommen 
nicht verhindern können. Es stellt sich die Frage, ob dies auch Konsequenzen 
für die gesellschaftliche Wahrnehmung digitaler Daten hat. Ist der Glaube an das 
Potential von Big Data womöglich erschüttert worden durch das Versagen steu- 
erbarer Normalität; und falls ja, wie nachhaltig? Oder führt der Glaube dazu, 
dass nun neue und weitreichendere Forderungen nach der Quantifizierung des 
Sozialen entstehen, um der Krise nun Herr zu werden oder Frühwarnsysteme ein- 
zurichten? So wird im Rahmen der Bewältigung der COVID-19-Pandemie auch 
immer wieder das Potential datenbasierter Lösungen hervorgehoben wie bspw. 
das Tracking von persönlichen Bewegungsprofilen auf Grundlage der Daten von 
Mobiltelefonen (Föderl-Schmid & Hurtz, 2020). Die Ausbreitung der Krankheit 
könne — so zumindest die Hoffnung — somit besser verfolgt, verstanden und ein- 
gedämmt werden. Hierbei richtet sich der Blick auch auf andere Länder wie 
Israel, Südkorea und China, die schnell entsprechende Maßnahmen einleiteten, 
die sich zumindest auf den ersten Blick bewährt haben. Während sich in Ländern 
wie Deutschland hier immer auch Fragen und Einwände bezüglich der infor- 
mationellen Selbstbestimmung stellen, könnte ein ausgeprägter Glaube an die 
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digitalen Daten bei manchen nun den Ruf nach noch umfangreicherer und sys- 
tematischer Datensammlung laut werden lassen. Es stellen sich mit Blick auf 
Privatsphäre und Freiheitsrechten konkrete Fragen der Abwägung von etwaigem 
Nutzen und Schaden extensiver Speicherung und Verwertung digitaler Individual- 
daten, die ob der Dringlichkeit der Entwicklungen schnell vom Tisch gewischt 
werden könnten. Denn große Versprechungen vermeintlicher Erkenntnisgewinne, 
die im Rahmen gesellschaftlicher Steuerungslogik so dringend benötigt werden, 
können insbesondere in Notsituationen dazu führen, dass etwaige Nutzengewinne 
überbewertet und Nachteile ausgeblendet werden. In diesem Zusammenhang ist 
auch die enge Verzahnung der Nutzenerwartungen bezüglich digitaler Daten 
für das Selbst mit einem Nutzen für die Gesellschaft als durchaus problema- 
tisch zu werten. So könnte die Angst vor dem Virus uns dazu bewegen, unsere 
Gesundheitsdaten anderen bereitwilliger zur Verfügung zu stellen. Getrieben vom 
Glauben, dass diese Daten genaue Einblicke in den Verbreitungs- und Krankheits- 
verlauf von COVID-19 erlauben und Erkenntnisgewinne im Kampf gegen die 
Epidemie liefern. Dieser Erkenntnisgewinn nützt dann im Fall der Fälle vielleicht 
nicht nur der Gesellschaft, sondern sogar einem höchst persönlich, so womöglich 
die Erwartung. Gleichzeitig macht man sich angreifbar und verletzlich, wenn 
die Daten von anderen missbraucht werden sollten. Was dem Kollektiv nützen 
mag, steht womöglich nicht immer im Einklang mit Individualinteressen, sondern 
kann sich im Widerstreit zwischen individueller Freiheit und gesellschaftlicher 
Sicherheit voneinander entkoppeln und auseinanderfallen. Vor dem Hintergrund 
eines sodann trügerischen Glaubens an datenbasierte Allheilmittel sollte daher 
stets kritisch geprüft und reflektiert werden, inwieweit man dem Drängen nach 
schnellen und allumfassenden technischen Lösungen hier nachgibt, die eine weit- 
reichende Datenpreisgabe erfordern und zur eingeschlichenen Normalität werden. 
Es stellen sich daher viele hochgradig aktuelle Fragen für die Zivilgesellschaft 
nach den Konsequenzen eines Glaubens an die digitalen Daten, die sich eine 
starke Zivilgesellschaft trotz oder gerade aufgrund der aktuellen Dringlichkeit 
der gesellschaftlichen Krisenlage weiterhin stellen sollte. 


Erkenntnisse und Anschlussfragen aus Sicht der Politik 

Aus Sicht der Politik ist mitzunehmen, dass in weiten Kreisen der Bevölke- 
rung eine hohe Akzeptanz der Digitalisierung besteht, die mit dem skizzierten 
Glauben an digitalen Daten zusammenhängt. Das Feld ist — zumindest dem 
momentanen Anschein nach - bestellt. Politische Programme und Maßnahmen 
stoßen auf eine positive Grundhaltung in der deutschen Bevölkerung, wenn sie 
sich mit dem Digitallabel schmücken können. Der Ruf nach Digitalisierung und 
hier insbesondere der Datensammlung und -verwertung erfährt aktuell insgesamt 
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kaum breite Ablehnung. Dementsprechend steht die Bevölkerung auch verwand- 
ten Phänomenen, die derzeit eine hohe Aufmerksamkeit erfahren, wie etwa der 
KI, weitgehend positiv gegenüber. Bestrebungen, Reformen und Innovationen 
auf Grundlage digitaler IuK in unterschiedlichen gesellschaftlichen Bereichen 
politisch durchzusetzen und zu implementieren, erscheinen vor diesem Hinter- 
grund vielversprechend. Zumindest solange sie nicht ohne guten Grund den 
Kern bürgerlicher Rechte und Freiheiten gravierend einschränken oder verletzen. 
Gleichzeitig besteht jedoch auch die Gefahr, dass hohe Erwartungen, genährt 
durch einen Glauben an die Potentiale digitaler Daten, durchaus enttäuscht 
werden können. Politische Programme und Reformen sollten daher in enger 
Abstimmung mit den direkt von ihnen Betroffenen erarbeitet werden, die häufig 
auch eine ganz eigene Expertise für die wirksame politische Gestaltung des Ent- 
wurfs einer digitalen Gesellschaft haben. Die beschlossenen Programme bedürfen 
dabei einer fortlaufenden Evaluation, die sie auf tatsächliche Erkenntnis- und Nut- 
zengewinne hin analysiert. Daher sollten sich auch die politischen Akteur*innen 
und Parteien nicht dem Glauben hingeben, dass irgendwie immer und über- 
all digitalisiert werden oder alles Mögliche in digitale Daten übersetzt werden 
müsste. Es sollte beständig abgewogen werden, weshalb digitalisiert wird, wofür 
Daten gesammelt werden und welche konkreten Maßnahmen vor dem Hinter- 
grund begrenzter öffentlicher Ressourcen am erfolgversprechendsten sind. Ziel 
sollte es sein, den Wähler*innen die gesellschaftlichen Veränderungen nicht 
einfach vorzusetzen und sich dabei in mancher Hinsicht einem Überbietungs- 
wettbewerb zu ergeben, der das technisch Mögliche ausreizt, während andere 
Themen verschlafen werden. Dabei sollten konkrete Begehren und Befürchtungen 
in der Bevölkerung ernst genommen werden. So sind Digitalisierung und dies- 
bezügliche Bedenken bspw. gar nicht so einfach in eine Rangfolge zu bringen, 
sondern beeinflussen sich fortwährend gegenseitig. Hiermit müssen sich Poli- 
tiktreibende zwingend auseinandersetzen, wollen sie politische Macht erhalten 
und ausüben sowie in Fragen der Digitalisierung der Gesellschaft als kompetent 
wahrgenommen werden. In der Beschäftigung mit der Digitalisierung erwerben 
sie selbst dabei ganz eigene Vorstellungen von der Beschaffenheit datenbasier- 
ter Techniken und Anwendungen und den Möglichkeiten und Konsequenzen der 
Quantifizierung des Sozialen. Auch Personen in politischen Ämtern und Funktio- 
nen sollten daher ihre eigenen Überzeugungen und Ideen vor dem Hintergrund 
ihres öffentlichen Auftrags hinterfragen. Daher sollte sich Anschlussforschung 
auch auf die Glaubensüberzeugungen von Akteur*innen des politischen Sys- 
tems beziehen, seien es Politiktreibende oder Personen aus der Leitungsebene 
öffentlicher Verwaltung, da ihnen nicht nur in Krisenzeiten durch ihre besondere 
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Rolle eine immense Bedeutung bei der Gestaltung und Organisation der digitalen 
Gesellschaft zukommt. 


Erkenntnisse und Anschlussfragen aus Sicht der Wissenschaft 

Für empirisch forschende Wissenschaft, deren Auftrag es ist, sich der Beantwor- 
tung der aufgeworfenen Fragen anzunehmen, wird der Glaube an digitale Daten 
in zweierlei Hinsicht relevant, gehören Daten doch für sie zum Kerngeschäft. So 
sollte zum einen die durch boyd und Crawford (2012) angestoßene Reflexion über 
Ungleichverteilung von großen digitalen Datenbeständen und deren Qualität für 
Forschungszwecke beständig weitergeführt werden. Nicht nur, dass große digitale 
Datensätze für viele kleinere universitäre Institute und Forschungseinrichtungen 
mit geringerer Ressourcenausstattung außer Reichweite geraten und dies gewich- 
tige Konsequenzen für die Teilnahme am wissenschaftlichen Forschungsgeschäft 
haben kann, wenn Big-Data-Analysen zum Maß empirischer Forschung erklärt 
werden. Auch die in dieser Arbeit aufgeworfenen Fragen nach Reliabilität und 
Validität sozialwissenschaftlicher Konstrukte und ihrer Messungen stellen sich 
insbesondere mit Blick auf Big Data weiterhin. Die Qualität und Aussagekraft 
beiläufig entstandener Beobachtungsdaten, die nicht originär für Forschungszwe- 
cke entstanden sind, sollten dabei stets kritisch hinterfragt werden. Es besteht 
hier die Gefahr, dass manch ein Forschungsansatz allein wegen der Verfügbar- 
keit von Big Data und innovativer Auswertungsansätze reüssiert, ohne Rücksicht 
auf theoretische Passung und eine geeignete Konstruktoperationalisierung. Vor 
den aktuellen Problemlagen institutioneller wissenschaftlicher Sozialforschung 
wie der Replikationskrise und gleichzeitiger Debatten um das Ende der Theorie 
stellen sich in einer Welt von Big Data weiterhin laufend Fragen nach dem wis- 
senschaftlichen Selbstverständnis sowie den Ansprüchen, die intern wie extern an 
Wissenschaft formuliert werden. In diesem Rahmen sollten sowohl die eigenen 
Überzeugungen von vermeintlich harter daten- und evidenzbasierter Erkenntnis 
von den Forschenden fortwährend reflektiert werden, als auch generell die an 
die Wissenschaft herangetragenen Erwartungen einer Gesellschaft, die womöglich 
vor allem das glaubt, was sich digital quantifiziert belegen lässt. 

Zum anderen sollte sich der Blick der Wissenschaft daher auch nach außen 
richten, wenn ein dominantes gesellschaftliches Wahrnehmungsmuster wie das 
BDGS diagnostiziert wird. Neben den zuvor aufgeworfenen Anschlussfragen 
stellen sich in vielen weiteren Forschungszusammenhängen Fragen nach dem 
Einfluss einer weitläufig bestehenden Überzeugung von der Notwendigkeit der 
Datensammlung und -verwertung sowie der Quantifizierung des Sozialen. Unter 
Zuhilfenahme der vorliegenden Konzeption und Messung des BDGS lassen sich 
hier weitere aktuelle gesellschaftliche Problemlagen analysieren und erklären. 


11.3 Ausblick 285 


Die Beschäftigung mit dem Einfluss des Glaubens an die Potentiale digitaler 
Datensammlung und -verwertung für Erkenntnis- und Nutzengewinne scheint 
dabei immer dort vielversprechend, wo neue Vergleichshorizonte entstehen und 
Eingang in medial vermittelte öffentliche Kommunikation finden — sei es die 
Bedeutung von Datensammlung und Statistiken im Spitzensport oder in den 
Kultur- und Unterhaltungsindustrien, für einen von Daten getriebenen Journa- 
lismus, doch auch im Alltag mit Blick auf das Self-Tracking und Rankings im 
Arbeitsleben oder im Hobby- und Freizeitbereich. Dort, wo soziale Phänomene in 
digitale Daten überführt werden und so be- und verwertet werden können, sind 
womöglich Wechselwirkungen mit dem BDGS zu erwarten: Zum einen könnte 
der Glaube an digitale Daten die Quantifizierung des Sozialen in vielen Berei- 
chen befördern, zum anderen könnte dies dann den Glauben weiter bestärken. Es 
ist die Aufgabe nachfolgender Forschungsbemühungen, die weitere Entwicklung 
des BDGS sowie dessen vermuteten Einflüsse auf sozialen Wandel zu analysieren. 


11.3 Ausblick 


Letztlich gibt es an dieser Stelle daher zwei Entwicklungen, vor deren Hinter- 
grund diese Arbeit abschließend eingeordnet werden soll und auf die im Lichte 
der gewonnenen Erkenntnisse eingegangen wird. Die eine Entwicklung betrifft 
den Entstehungszeitpunkt dieser Arbeit zu Beginn der 2020er Jahre in einer Welt, 
die seit nun mehreren Jahrzehnten Erfahrungen mit dem Einfluss der durch die 
Verbreitung von Computern vorangetriebenen Digitalisierung auf Individuum und 
Gesellschaft sammelt. Die andere Entwicklung betrifft die Rolle der EU in der 
digitalisierten Weltgesellschaft vor dem Hintergrund der Analyse des BDGS in 
der deutschen Bevölkerung. 


Die Digitalisierung der Gesellschaft 

Noch lange ist die Gesellschaft, auch und vor allem in Deutschland und Europa, 
keine vollends digitale, selbst wenn immer mehr Lebensbereiche von der Digi- 
talisierung beeinflusst werden. Wer auf die 2010er Jahre zurückblickt, der sieht, 
dass dort, wo Digitaltechnik die Gesellschaft durchdrang, sich nicht nur Vorteile 
materialisierten, sondern auch etwaige Schattenseiten der Digitalisierung aufta- 
ten. Als einer der ersten hat Morozov (2012) für die Bürger*innen der weniger 
entwickelten Länder und den Autokratien die Stimme erhoben und mit Recht 
darauf hingewiesen, dass die Digitalisierung bei allen potentiellen Vorteilen auch 
als Machtinstrument zu begreifen ist, das dazu eingesetzt wird, soziale Ordnung 
‚von oben‘ zu beeinflussen. 
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Die Entwicklungslinien der Digitalisierung sind somit in allen Gesellschaf- 
ten vor dem Hintergrund sozialer Ordnung und ihrer Stabilisierung unter Einsatz 
endlicher Ressourcen zu verstehen. Dabei haben die materiellen Artefakte der 
Digitalisierung weite Verbreitung gefunden und wurden von Menschen in so gut 
wie allen Ländern der Erde bereitwillig aufgenommen und genutzt. 

Gleichzeitig kommt es immer wieder auch zu Reflexionsprozessen und verein- 
zelten Widerständen dort, wo Digitaltechnik und die Sammlung und Auswertung 
großer digitaler Datenbestände soziale Fragen betreffen. Im Rahmen der wis- 
senschaftlichen Analyse individueller und gesellschaftlicher Wahrnehmung der 
Digitalisierung wird dabei auch immer wieder darauf eingegangen, welche Kon- 
sequenzen der Umgang mit Computertechnik für das Bewusstsein und das 
Denken der Menschen hat. Dabei wurde die Existenz von digitalisierungsbe- 
zogenen Wahrnehmungsmustern und Denkstilen immer vorausgesetzt, um die 
vermeintlichen Auswirkungen dieses Denkens zu diskutieren. 

Die Erkenntnisse der vorliegenden Arbeit indizieren, dass ein solches Den- 
ken über und mit digitalen Daten zwar durchaus differenziert ausfällt. Es zeigt 
sich jedoch auch, wohin ausgeprägte Überzeugungen vom Erkenntnis- und 
Nutzengewinn aus digitalen Daten führen können, wenn die Aktivierung die- 
ser Kognitionen einen Einfluss im Rahmen der Einstellungsbildung digitaler 
Innovationen aus dem Bereich der KI nimmt. Mitunter fallen entsprechende 
Abwägungen bezüglich deren Implementierung und ihres weitreichenden Ein- 
satzes nicht in der Tiefe und Gründlichkeit aus, wie es vor dem Hintergrund der 
Bedeutung gesellschaftlicher Datensammlung und -verwertung geboten wäre. 


Die Rolle der EU 

Es muss dabei an dieser Stelle auch auf die Position und Rolle der EU in der 
globalen Datenökonomie des 21. Jahrhunderts Bezug genommen werden, die bei 
der Reflexion über die gesellschaftliche Wahrnehmung digitaler Daten nicht außer 
Acht gelassen werden darf. Die EU findet sich zu Beginn der 2020er Jahre in 
einer besonderen Situation und geht in Sachen Digitalität einen ganz eigenen 
Weg. Die Länder der EU und so auch Deutschland genießen alle Vorteile der 
Digitalisierung. Ihre Bevölkerungen wähnen sich in weitreichender sozialer und 
ökonomischer Freiheit, während die vermeintlichen Nutzengewinne der Digita- 
lisierung ausgekostet werden. Auch hierin vermag ein Grund zu liegen, warum 
der Begriff Digitalisierung eine so hohe Zustimmung findet. Dennoch darf die- 
ser Blick auf das Positive nicht die Sicht auf die spezifischen Herausforderungen 
verstellen, denen sich die Gesellschaft(en) der EU gegenübersieht. 
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Der Anteil der EU und ihrer Mitgliedsländer an der Weltbevölkerung und am 
Weltwirtschaftsprodukt ist rückläufig (Europäische Kommission, 2014; Internatio- 
nal Monetary Fund, 2019). Das gilt auch bezüglich des Anteils an den weltweit 
produzierten Daten. Längst entsteht ein Großteil der Daten nicht mehr innerhalb 
der EU. Von den 100 am meisten besuchten Webseiten kamen 2019 zwei aus der 
EU und stammen von der britischen öffentlich-rechtlichen Rundfunkanstalt BBC 
(Routley, 2019). Nach dem Brexit gibt es also keine europäische Webseite in 
den Top 100. Auch in der von Forbes rausgegebenen Rangliste der umsatzstärks- 
ten Unternehmen finden sich für den Sektor Technologie wenige europäische 
Unternehmen. Als erstes europäisches Unternehmen kommt das in Irland ansäs- 
sige Technologieberatungsunternehmen Accenture auf Platz 20, gefolgt vom 
deutschen Unternehmen SAP auf Rang 33. Die umsatzstärksten Unternehmen 
kommen überwiegend aus den USA oder Südost-Asien. Selbstredend erzeugen 
und verwerten heutzutage nicht nur Technologie-Unternehmen digitale Daten. 
Auch in der Industrie, einer starken Domäne der deutschen Wirtschaft, fallen 
viele digitale Daten an, die ökonomisch verwertet werden können. Doch der 
europäische Einfluss auf der Weltbühne schwindet. 

Dabei ist die europäische Idee nach wie vor mit bestimmten Werten und einem 
aufgeklärten Menschenbild verbunden — und das ist nicht nur eine Floskel, son- 
dern zeigt sich an konkreten Beispielen. Informationelle Selbstbestimmung ist 
ein Gut, das in anderen Ländern dieser Welt durchaus anders bewertet wird als 
in der EU. Auch deshalb hat sich die EU mit der Europäischen Datenschutz- 
Grundverordnung (EU-DSGVO) einen rechtlichen Rahmen der Datenverwertung 
gegeben, der weit über den Datenschutz hinausgeht, der anderswo praktiziert 
wird. Bei aller Kritik an der tatsächlichen Umsetzung zeigt der Gedanke, den 
Menschen mit Blick auf die Digitalisierung gewisse Rechte einzuräumen, dass es 
den europäischen Gesellschaften nicht egal ist, was den Biirger*innen im Rahmen 
der Digitalisierung widerfährt. Mit Blick auf Rechtsstaat und Zivilgesellschaft 
stehen die europäischen Gesellschaften im internationalen Vergleich bislang gut 
da, auch und insbesondere, was die Digitalisierung betrifft. Nun stößt natürlich 
auch jenes Regelwerk in einer globalisierten Welt schnell an seine Grenzen und 
es wird mit Nachdruck darauf verwiesen, dass Politik und Rechtsprechung kaum 
mit der Digitalisierung Schritt halten können. Die Bürger*innen Europas sollten 
und dürfen sich dabei keiner Illusion über Europas Gewicht auf der digitalen 
Weltbühne hingeben. Europas Anziehung speist sich aus einem anderswo uner- 
reichten Lebensstil und dem relativen Wohlstand, der eine notwendige, jedoch 
nicht hinreichende Bedingung dieser Strahlkraft ist. 

Die Generationen, die nach den großen Kriegen des 20. Jahrhundert geboren 
sind, schauen auf Europa und fragen sich, wie es jemals anders sein könnte — im 
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Guten wie im Schlechten. Das ist nicht als Abgesang auf Europa zu verste- 
hen, sondern als Aufforderung vor dem Hintergrund der Überzeugungen vom 
Potential und der Wirkmächtigkeit digitaler Daten in Europa und Deutschland 
weiterhin kritisch über die Digitalisierung nachzudenken. Es ist das Resümee der 
vorliegenden Arbeit: Es reicht nicht daran zu glauben, dass Sammeln und Aus- 
werten digitaler Daten Erkenntnisse ermöglichen, die dem Individuum und der 
Gesellschaft Nutzen bringen, man muss sich auch aktiv und selbstkritisch darum 
bemühen. Meine Hoffnung ist, dass diese Arbeit einige Erkenntnisse und Denkan- 
stöße zur Reflexion über den Menschen in der digitalen Gesellschaft liefert. Nicht 
nur, was die Gesellschaft über und durch die Sammlung und Verwertung digitaler 
Daten weiß, sondern insbesondere, was wir glauben durch und über diese Daten 
wissen zu können, ist und bleibt eine der wichtigen Fragen unserer Zeit. 
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